谷歌推出手写文字数字化AI技术 复杂背景及暗光
谷歌推出手写文字数字化AI技术 复杂背景及暗光
近日,Google Research推出了一项创新的人工智能技术——InkSight,该技术能够直接从手写文字图片中提取数字文本,无需借助任何中间设备。这一技术突破,为手写文字识别领域带来了新的变革。
与传统依赖光学字符识别(OCR)的手写文字识别技术不同,InkSight在处理复杂背景、模糊或低光照条件下的手写文字时,表现更为优异。它采用了一种模仿人类学习阅读过程的方法,通过不断重写文本,学习单词的外观和含义。
InkSight在复杂场景下的识别能力尤为突出,即使文本部分遮挡或背景干扰,也能准确识别手写文字。研究人员发现,人类阅读InkSight生成的文本描摹的准确率高达87%,其中三分之二的描摹结果与真实手写几乎无法区分。
InkSight技术对于喜欢手写的人群具有巨大潜力。用户只需将手写笔记拍摄成照片,即可迅速将其转换为可搜索的数字文本。此外,对于字迹潦草的内容,InkSight也能实现清晰、准确的打印文本转换。
值得注意的是,谷歌并非唯一一家致力于手写识别AI技术的公司。亚马逊的Kindle Scribe电子阅读器和数字笔记应用Goodnotes等也推出了类似功能,将手写文字转换为可编辑的数字文本。