w88_优德88官方网站_优德88手机登录

优德88 ios_w88优德官方_w88优德娱乐平台亚洲

admin1周前139浏览量

不断向开源社区添砖加瓦的微软近来又有大动作-- 将强壮的最近邻查找算法开源。2019年5月15日,GitHub存储库上的开源社区成员都可以拜访微软的空间分区树和图(SPTAG)算法,该算法“答应用户充分利用学习模型在以毫秒为单位时刻内智能查找数十亿条信息(也称矢量)。”

咱们每个人每天都在享用各种在线服务(在线查找、新闻引荐等)所带来的种种便当。这些服务的背面隐藏着巨大的、需求核算机实时处理的数据。例如,在图画查找范畴,面临给定的一幅查询图画,体系要从巨大的数据库里(比方包含百万、千万乃至上亿图画)快速找出类似的图画;而在新闻引荐中,核算机也需求依据用户画像,从很多的新闻中找到最相关的新闻引荐给用户。

想要从海量数据中快速找到有用数据离不开最近邻查找算法。最近邻查找是核算机视觉、机器学习、多媒体查找、核算几多么范畴里十分根底、也是十分重要的问题。现在主要有两种削减查找时刻的办法:根据哈希的近似最近邻查找的办法经过规划和优化哈希函数,削减核算的次数,然后缩短查找时刻。根据量化的近似最近邻查找办规律经过聚类把向量集聚成若干类,每类里边的向量用对应的类中心来近似。

而今日微软在GitHub上开源了根据近邻图的最近邻查找算法--空间分区树和图(SPTAG),它是Bing查找的底层人工智能技术之一。现在你在Bing上查找“巴黎的塔楼有多高?”他们会告知你艾菲尔铁塔高324米(1,063英尺),与81层高的修建大致相同。虽然在查找关键词中并没有呈现“埃菲尔”(Eiffel)这个单词,而且在查找成果中也没有“高”(tall)这个单词。

该公司在今日的布告中写道:“仅在几年前,网络查找很简单。用户输入几个单词并阅读成果页面。今日,相同的用户或许会在手机上摄影并将其放入查找框中,或运用智能帮手发问而无需亲身接触设备。他们也或许会输入一个问题并等待一个实践的答复,而不是一个或许答案的页面列表。”

当然,矢量查找自身并不是一个新主意。但是,微软所做的是将这一概念应用于深度学习模型。首要,团队选用预先练习的模型并将数据编码到矢量中,其间每个矢量代表一个字或像素。然后运用新的SPTAG库生成向量索引。跟着查询的进入,深度学习模型将该文本或图画转换为向量,而且库在该索引中找到最相关的向量。

微软表明,“经过Bing查找,矢量化作业现已扩展到查找引擎索引的超越1500亿条数据,然后带来了对传统关键字匹配的改善。” “这些包含单个单词,字符,网页摘要,完好查询和其他媒体。一旦用户查找,Bing就可以扫描索引的向量并供给最佳匹配。“

声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间服务。