用 AI 和爬虫搜索技术来“海里捞针”,印度 VaultEdge 要做个人邮件信息搜索的 Google

36氪  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

用 AI 和爬虫搜索技术来“海里捞针”,印度 VaultEdge 要做个人邮件信息搜索的 Google

对很多职场人士而言,从一大堆不同的邮件账号中寻找特定文件是个很头痛的事情,如果文件要的急、时间又隔太久,还忘了关键词,这种情况下,想要快速找到所需文件,如同“海里捞针”,可谓是难上加难。

VaultEdge 的创始人兼 CEO Sajeev Aravindan 在 2015 年的时候意识到了这个普遍存在的问题,于是他创办了 VaultEdge。

VaultEdge 的产品是一款可以帮助用户对资料、邮件进行分类和查找的智能搜索助手。用户注册登录后,把邮件账号的访问权限开放给它,之后 VaultEdge 会对你所有账号里的信息进行智能整理,并根据不同的领域进行分类,以账单为例,系统会把用户的移动话费账单、水电费单等按公司进行分类(比如 Airtel 账单、 Vodafone 账单),更进一步,系统会在文件描述中记录费用产生时间、收到账单时间等以方便用户操作;如果用户要搜索某个文件,除了可以输入关键词外,还可以根据语义进行索引,即便所查找词汇并未在文件中提到,系统也可以按你的语义描述找到相关文件。

用 AI 和爬虫搜索技术来“海里捞针”,印度 VaultEdge 要做个人邮件信息搜索的 Google

VaultEdge宣传界面

要实现上述功能,VaultEdge 主要有两项核心技术:一个是其开发的一种网络爬虫搜索技术,它可以聚合所有邮箱中的文件信息,按其标准进行详细分类(包括文件创建、修改、收发时间等);另外一个是 VaultEdge 的人工智能机器学习技术,它会自动为用户找出相关的信息,支持这款应用的算法经过训练,已经能够识别账单、工资条、税单等 12 类这样的词汇,而且其智能学习技术随着用户使用多次后可以更好地支持单一用户的个性化语义索引。

在安全性上,VaultEdge 通常会将用户文件上传云端,但用户也可以自行决定将私密文件存在本地。对此担忧,Sajeev 表示:“我们的加密技术非常棒!你的数据被分解成上千条离散的信息,每一条都经过加密。所以说如果黑客想要窃取你的信息,那么他们破解这些编码就要花上几年时间。”

至于未来产品发展,Sajeev 认为 VaultEdge 拥有很多潜力,他计划未来借鉴谷歌推出语义搜索功能。语义搜索不只局限于用户所输入请求语句的字面本身,而是透过现象看本质,以准确地捕捉用户所输入语句后面的真正意图以及相关语境,并以此来进行搜索,从而更准确地向用户返回最符合其需求的搜索结果。“设想一下你的老板要你发一份税单文件给他,VaultEdge 就会识别这种要求,自动搜索到目标税单,并自动将其添加在你的回复中”,Sajeev 举例说道。

不过这种功能必须要在 VaultEdge 的机器学习技术 100% 精确的情况下才会实现。“随着用户的增加,我们的系统会被训练着去识别更多复杂的陌生关键词。”Sajeev 说道,他表示目前 VaultEdges 的搜索准确率已达到 80%。

创始人背景上,Sajeev 此前在 NetApp 担任全球技术架构师,主要从事信息存储和分析。他在有了 VaultEdges 这个创意后就于 2015 年 9 月辞职,然后在今年 9 月将其产品 Beta 版本上传到了 Product Hunt 上。

至于投融资上,Sajeev 表示公司暂时不会进行融资,“等我们把公司做大,投资者就会自己来找我们”,他说道。

除了 VaultEdges,还有不少公司在做类似的专注个人信息搜索的项目,如 CloudO 和 FindO 等。

随意打赏

搜索个人信息网络爬虫技术vault爬虫技术
提交建议
微信扫一扫,分享给好友吧。