Android Smart Linkify API背后的机器学习

Smart Linkify建立在先前版本Android Oreo宣布的Smart Text Selection之上

2018年8月初,谷歌正式宣布了代号为“Pie”的Android 9,Android正在推出一系列由人工智能供给支持的新功能,Android Smart Linkify便是此中最紧张的新AI功能之一Smart Linkify可以检测文本中的某些类型的实体(例如地址、电话号码)并添加可点击的链接,容许用户直接启动舆图或拨打电话它由设备内的前馈神经收集供给支持,每种说话大年夜小仅500KB,推理代码不跨越250KB这个系统为几近实时的系统,在Google Pixel手机上谋略光阴不到20毫秒

系统首先经由过程空格将输入文本拆分为单词,并谋略最多15个单词所有可能的单词子序列每个子序列被供给给神经收集,神经收集基于其有效性为它们分配[0 … 1]范围的值在删除重叠实体后,系统为子序列打较高的分数在全部历程的第一部分停止时,每个未知类型都有一个不重复单词子序列

然后应用第二个神经收集来识别每个单词子序列的类型,无论是电话号码、地址照样未识别的实体神经收集将高低文中的单词子序列作为输入经由过程将子序列的前三个和后三个单词作为实体,将它们前面的五个单词作为左高低文,将随后的五个单词作为右高低文,然后将它们作为不合的特性来识别单词的含义这个神经收集中一个有趣的优化是应用二进制特性来识别以大年夜写字母开首的单词其背后的缘故原由是,收集邮政地址异常独特,应用这种要领更轻易识别出来

为了练习神经收集,谷歌团队从真实数据中天生了虚假而实际的样本他们应用 Schema.org 评释的实体、地址、电话号码和随机单词的自定义列表,合成了一个练习集他们采纳可察看的实体并用随机单词环抱它们来达到更抱负的结果别的,他们还故意天生负数据来练习样本,让神经收集避免将“ID:”等短语辨觉得电话号码

国际化是该功能的一个紧张方面,根据测试,一种模型适用于所有拉丁说话,并可以为中文、日文、韩文、泰文、阿拉伯文和俄文添加零丁的模型今朝,API支持16种说话,未来几个月将支持更多说话这些模型应用TensorFlow进行练习,自定义的推理库由TensorFlow Lite和 FlatBuffers 供给支持开拓职员可以经由过程 TextClassifier API 的 generateLinks 措施开始应用Smart Linkify

赞(0) 打赏
分享到: 更多 (0)
免责申明:本站所有资料均来自于网络,版权归原创者所有!本站不提供任何保证,不保证真实性,并不承担任何法律责任

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

阿里云优惠网 更专业 更优惠

阿里云优惠券阿里云大礼包