AI启示录-普通人怎么理解多模态

多模态通常指的是在一种人工智能系统中,同时支持多种不同类型的输入和输出数据,例如图像、声音、文本等等。这些不同类型的数据可以被整合在一起,以提高系统的准确性和效率。例如,一个多模态的自然语言处理系统可以同时接收文本、语音和图像,以更好地理解用户的意图和需求。这种方法可以使得人工智能系统更加智能、全面和适应性强,从而更好地为人类服务。


大家应该都听过或者了解过标注,最常见的就是人脸识别,自拍的时候会自动聚焦人脸或者出现一个选定框

人脸扫描

计算机知道这个是人脸,甚至知道是谁。但是更深入的信息就不知道了

再来个高级点:


GPT4测试题

上面这个测试题,用我们早前的人工智能去识别,它会理解成:有一堆文字,有张图表!

或许确实在某个方面告诉来我们答案,但是给出的信息有用么?显而易见,是没有任何价值的。

现在再来说多模态AI就好办了,

需要解答上面这个物理题,AI必须要具备:

语言理解能力

数学能力

物理能力

图像识别能力

...

然后再结合这些能力去解答这个问题。

通过图中的文字去理解这个题目

再通过图像识别区看条件

再通过数学和物理知识去求解

等人工智能再升级的时候,就可以生产虚拟形象通过AI语音直接成为一个老师教你相关的知识,它会比普通的老师更耐心,更专注,知识面更广阔。。


说到这里,老师别慌~还有其他职业会和你接受到一样的冲击,贫道道友一起G~

庆幸的是,人工智能爆发还处于起点,我们可以转换身份去让AI帮我们把现在的工作做的更好。就看你能不能跟上来!

展开阅读全文

页面更新:2024-03-18

标签:道友   人工智能   启示录   普通人   语音   图像   文本   物理   能力   老师   文字   系统

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top