当前位置:首页 > 创业科技 > 正文

非结构化数据在人工智能中的作用

非结构化数据对人工智能系统的发展至关重要。人工智能系统与用户的沟通越好,就越能自主学习,因此,它的效率也就越高。这一点很重要,因为如果一个人工智能系统只要求用户以结构化的格式进行交互,那么它的组件将受到极大的限制。为了让人工智能成功,它必须理解杂乱的信息。

人工智能(AI)系统的交互过程更像人类,这让一些人感到不舒服,但人工智能并不是要取代人类。实际上,它更多的是把机器人从人类身上移除。人工智能的价值很大一部分在于自动化人工过程和快速分析大量数据,这样人类就可以自由地完成需要理性和判断力的高阶任务。然而,要达到这一点,人工智能系统必须能够与用户通信并分析自然形式的数据(又称非结构化数据),所有无法以整洁的方式打包的自由流动的数据,如语音、图像和文本。

[[277773]]

非结构化数据对人工智能系统的发展至关重要。人工智能系统与用户的沟通越好,就越能自主学习,因此,它的效率也就越高。这一点很重要,因为如果一个人工智能系统只要求用户以结构化的格式进行交互,那么它的组件将受到极大的限制。为了让人工智能成功,它必须理解杂乱的信息。

在这种情况下,需要深入了解非结构化数据是如何发挥作用的。

非结构化数据的挑战

在人类的世界里,当人们进行对话时,如果不按礼仪说话。可能任何东西都会出现在我们的脑海中,以某种可能遵循或可能不遵循惯例的配置。人们可能使用俚语,讽刺和开玩笑。人们把日常语言和希望传达的信息组织成整齐的列和行是不自然的。语言本身就是非结构化的。

如果人们曾经与亚马逊公司的Alexa进行过互动,那么就会知道虽然Echo系统通常非常熟练地理解自由格式命令,但缺乏定义的协议有时会导致问题,或者至少在Alexa尝试回答时会产生幽默的回应查询不适合模具。亚马逊公司已投入大量资源和数百万美元用于创建和永久性地改进算法,使这种类似人类的语音能够响应命令,但正如Echo熟练解读自由流动语言一样,Alexa仍然存在缺陷。

Alexa示例强调了一种非结构化数据的复杂性。人工智能系统处理和创建与文本等效的数字的能力也是一项很高的要求,特别是当企业考虑细微差别和场景的重要性时。想象一台机器试图“理解”家庭度假中那张照片中发生的事情,或者是一部关于印象派的艺术史教科书中的图像。

与处理非结构化数据相关的复杂性可能是企业中人工智能的更大障碍。然而,它们并不是不可逾越的。

专业知识的重要性

非结构化数据本身就是噪声。因此,它需要大量的专业知识来突破、梳理和检测模式,然后开发识别这些模式的模型。数据科学家正在积极推动人工智能系统的改进,更大的成功表明人类的本能和经验是必需的。这通常发生在团队专注于非常狭窄的人工智能应用时。

以工作人员的赔偿索赔程序为例,对