锤子手机热门交互功能 “大爆炸( Big Bang )”正式开源
1 月 12 日下午 2 点,锤子 科技 在 github 上对“大爆炸( Big Bang )”功能进行开源。据了解,本次开源代码包括“大爆炸”所有的框架层以及 UI 层的代码, 手机 厂商、 ROM 开发者通过修改使用源代码,可实现大爆炸的功能。
10 月 18 日,锤子手机在年底旗舰产品 M1 发布会上,同时发布 Smartisan OS 3.0 ,两大全新的功能“一步( One Step )”和“大爆炸( Big Bang )”引起了广泛关注。其中 “大爆炸”瞄准了智能手机在编辑信息环节的一大痛点,只要用拇指大面积按压屏幕中的文字,“大爆炸” 会将按住的那段文字全部“炸”开,按照语义智能拆分成独立的字和词,选择文字即可搜索、分享和复制,开创性地解决了在手机屏幕上难于处理文本信息的用户痛点。锤子科技 CEO 罗永浩在当天的演讲中表示,锤子计划将“一步”和“大爆炸”两项功能对社会开源。
12 月 1 日,随着锤子 Smartisan OS 3.2 版本发布,“大爆炸”功能完成进一步升级:可以炸开图片上的文字。通过内置 OCR 技术,几乎可以炸开任意界面,无论是 微信 订阅号文章、朋友圈、微博,只要有文字信息均可炸开和提取。例如,纯色背景下的长微博(包括标点符号)、标准打印字体、清晰的图书扫描等识别率都很高,中英文混排的语句的分词效果也很好。
据锤子科技软件研发副总裁邹伟介绍,整个“大爆炸”的实现,是锤子 Smartisan OS 与三角兽的分词技术、扫描全能王的 OCR 技术深度整合通力合作的结果。三角兽负责进行分词的算法与优化,扫描全能王负责图片的识别解析,而锤子做了两件事:一个是打通界面与文字的区隔,尽可能用技术手段直接提取出文字,为此全系统做了很多工作配合文字提取,包括浏览器从内核层面上给予了支持,允许“大爆炸”从网页中提取文字;二是从系统层面上整合这些技术,再根据用户的实际使用体验,交互与需求,不断进行打磨和优化。
三角兽科技针对此次锤子大爆炸功能开源,特意开放了分词技术的线上接口,因此要求用户在使用这一功能时需要联网。开发者需要注意的是,如需炸开图像文字功能,还需联系上海合合信息科技发展有限公司(扫描全能王)提供技术支持。
而早于“大爆炸”一个月开源的“一步( One Step )”,在 12 月 20 日正式开源后,一周左右就冲到 github 周排行榜第二名,截至目前已收获 1400 多个好评( Unstar )。 12 月 25 日,首个适配锤子科技 One Step 功能的第三方 ROM FIUI 开发完毕, One Step 开源项目实现了落地。
“我们希望通过 One Step 和 Big Bang 功能,带来手机交互上的重要提升,让手机能帮助人们更高效地解决很多以前只能在 PC 上完成的工作,让智能手机更接近甚至超越桌面电脑。”锤子科技 CEO 罗永浩表示,开源能够让更多的手机厂商和第三方应用开发者集成这两项功能,也希望 Google 能够在安卓底层应用该机制,成为安卓的下一代标准,让人们更便利高效地使用智能手机,为整个智能手机领域的产品进化贡献一点力量 。