潮新闻客户端 记者 汪雨晨 编辑 谢履冰
编者按:让思想被听见,让价值被传递。潮新闻推出《声动》栏目,聚焦社会各界名家大咖、领军人物的声音,为时代留声。
今天为您带来上海生声不息科技公司创始人邱生峰在通义实验室X一席2026年度开发者演讲活动上的演讲。他出生时因缺氧导致脑瘫,发音有些不清,运动姿态也有些异常,他一直都在探索怎么帮助残障伙伴更好生活。这次,AI帮助达成了演讲的心愿。

图源:主办方
我是邱生峰,目前是上海生声不息科技创始人。此刻你们看到屏幕两边的字幕,是我做的AI工具“燃言”。
“燃言”可以听懂我说的话,再翻译成文字,呈现在屏幕上。这是一个诞生3个月的产品,还远不够完善,但是它已经能够给我带来一些真实的帮助。
这是我二十多年来第一次演讲。今天能站在这里,我想分享一些关于燃言的小故事,以及我自己在成长过程中的一些思考。
我一出生就患了脑瘫,导致说话有些不清楚,但是还算幸运,家人、朋友还比较友好,就这样一路在比较正常的环境里面上学、工作、创业,中间也会有一些小波折,比如高三大家学习比较紧张时,不知道怎么和别人沟通,也很少有人愿意和你主动沟通,导致一度状态比较低落。
后来我考上重庆大学数学系,进入人工智能领域,成为一名算法工程师。
职场里,效率是第一语言。在开会、谈合作的很多瞬间,我逐渐意识到一个更根本的问题:
我们最大的困难,从来不是生理上的“说不清”,而是环境里的“不愿等”。
从算法工程师到AI Agent领域的创业,我天天和模型打交道。去年,我参加了通义实验室发起的「小有可为」AI向善比赛。主题是用AI赋能残障生活场景。我看到了助盲眼镜、智能轮椅,开发者的故事给了我很多启发。
我当时就想:能不能做一款解决发音不清人群表达问题的产品?
真正推动我动手的,是和多位有相似困扰的伙伴交流后,加上产品调研的发现:国内确实缺少这样一款成熟的产品。因为市面上绝大多数AI语音工具,只能识别标准发音,很难听懂像我们这样的声音。这也是为什么,燃言希望“让每一种声音,都被听见”。
技术上,我和两位伙伴把全球60多篇关于构音障碍的论文,整理成了一个开源仓库。我们基于Fun-ASR和Qwen3-ASR等开源模型,复现并优化了其中有效的方法。
但核心难点不在算法,而在数据。
中文构音数据极其稀缺,而大模型架构参数量越大、效果越好,对数据和算力的需求就越苛刻。
数据方面,我们尝试用合成数据缓解了一部分问题,另外我和30多位种子用户,每天坚持录音、标注、迭代。
算力方面,我一个人带着项目去北京路演,换来了训练资源。过程很具体,也很笨拙,但一步步走通了。
但我很快意识到:光是提升模型准确率,并不能完全解决问题。之所以现在没有一款真正很好解决这个问题的产品,正因为构音障碍不同程度,不同病种的人群差异比较大,生活中面对的场景也复杂。
有用户说他讨厌在外面被家人替代表达自己的想法,有用户说他希望能够用自己的声音主动参与到社交中。这些需求定义了我们的产品。
在AI时代,把需求转化为产品,是一项很重要的能力。
本质上,它考验的是对自己和外界的认知边界。
为此,燃言针对语音场景,自研了一套语音agent架构。智能体这个概念火了很久,最近龙虾也出圈了,那他们的核心是什么呢?
我想可以分为以下三点:记忆、上下文、人机交互。
他们可以解决用户什么问题呢?
更好的记忆解决不同用户个性化场景需求;好的上下文管理和比如硬件带来的更多的上下文就能够覆盖更多场景;好的人机交互让产品真正让位成为助手。
这是趋势,但是要做出好的产品,要聚焦核心,不断打磨。
燃言核心的三个功能就是实时辅助沟通、语句训练反馈、个人记忆管理。在我看来,这三个场景是一环扣一环,最终也希望它们可以互相促进,帮助用户解决更多实际需求。
凭借越来越好用的Ai,可以快速做出一些产品原型,可以解决一些日常的问题。
但是AI肯定不是万能的,我要怎么去定位它?
AI是一个促使我更快成长的伙伴,我要当它的眼睛、它的耳朵,带着对世界的好奇和情感,发现真正的需求,产生人与人之间真实的、真诚的链接,和AI一起解决更多伙伴的需求,创造出一些美好的、好用的作品,燃言是第一个,这是一个好的开始。
过去我常想:如果有一天,我能流畅地表达,我想说什么?
现在我觉得,说什么没那么重要。重要的是,我终于可以说了。
谢谢每一位愿意停下来,听懂我的人。
愿像我一样的人生声不息,愿我们都能勇敢发声。
更新时间:2026-04-12
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号