
3月25日,“佛山(南海)人工智能产业发展论坛暨科大讯飞佛山人工智能产业基地成立仪式”在南海区举行。该基地将依托科大讯飞人工智能核心技术和上下游产业生态资源配资公司有哪些,聚焦场景应用与生态培育,推动区域人工智能产业生态发展和产业转型升级。
![]()
本次活动中韩端科技、声临奇境、零动未来、中远惠科与科大讯飞进行签约,成为基地首批入驻企业。聆动通用、探物智能、泰升药业、小象智能等各AI+应用领域与该基地达成合作共识。
会上,科大讯飞副总裁方明发表题为《革新未来的AI大模型时代:大模型技术及应用场景探究》报告。
![]()
他提到,人工智能在不断克服诸多挑战,首先是泛化识别的准确率问题。语音识别的模型如果用北京人的普通话训练出来,拿到广东不一定会好用,因为粤语和普通话存在很大差别。
第二个难点是“鸡尾酒会效应”,人类听觉系统具有一种出色的能力,可以在嘈杂的人群中专注于一场对话而过滤掉其他刺激因素。但要人工智能准确识别一大堆语言中特定人的说话则非常不容易。
第三则是,目前大家出国可以用翻译机,但市面上大量的翻译机需要提前切换,比如到欧洲旅游,需要知道对方是说英语、法语还是西班牙语还是葡萄牙语,“他咕噜咕噜说一句,你怎么知道他说的是西班牙语还是葡萄牙语呢?”
他说,目前,科大讯飞推出的翻译机是免切换的,不管对方说的是哪个国家的语言,不需要听懂就可以直接翻译成中文。
方明说,随着大模型的接入,人工智能识别率又有了新的提升。例如,中国人说,“夏天能穿多少穿多少”“冬天能穿多少穿多少”,但其实,英语对应的是“As little as you can wear”和“As more as you can wear”,不同的话翻译成中文其实是同样的一段话。
“翻译软件不一定能识别,但现有的大模型可以准确识别出来。”方明说,机器学习已会“迁移学习”。
什么是迁移学习?方明打了个比方,以色列说的是希伯来语,特别难学,因为希伯来语是从右往左书写的,这与大多数从左向右书写的语言(如英语、汉语等)截然不同。
“你去学希伯来语,恐怕你掌握的中文和英文能力,对你学一门新语言帮助未必很大,学语言的速度不见得比以色列中学生要快,但是AI只要学了中文和英语,再让它再学希伯来语,可以在极短时间内掌握。”方明说,6年前,科大讯飞一门全新的外语翻译成现有语系,需要用两周时间,到去年这个时间已经缩短成了两天。
随着大模型的应用,新的场景需求也在不断被激发出来。
“借助大模型,以前挣不到的钱现在能挣到了。”方明举例说,与中国移动共建人类首个无障碍通信平台,在5G网络基础上,不依赖特定手机,不用下载任何APP,即可实现无障碍视频通话。
也就是说,在和国外友人电话时,手机会自动唤起视频通话界面,也不用管他说的是哪个国家语言,手机屏幕上就可以看到实时翻译过来的汉字。
“你只要开口说中国话,对方也能在他的手机屏幕上看到实时翻译成他能看懂的文字。”方明说,这对外贸生意将很有帮助,而中国移动也有望创造新的收入。
他表示,未来企业的核心竞争力,不是厂房,不是土地,而是员工们的想象力,只要有一个好的想法,大模型就能形成产品可研报告、执行方案,想象力加上大模型,就会是未来的新质生产力。
南方+记者 郜小平