首页 > 活动线报 > 每日福利 > 车圈最大AI「黑马」吉利:自研语音大模型登顶,性能超SOTA10%

车圈最大AI「黑马」吉利:自研语音大模型登顶,性能超SOTA10%

发布时间:2024-09-25 09:32:23来源: 13041198719

从汽车到人工智能:吉利如何逆袭,超越传统科技巨头的三大秘笈

 

图片来源于网络

 

在智能科技迅速发展的时代中,传统汽车制造商吉利以一种意想不到的方式崭露头角,成为人工智能领域的黑马,这不仅让人惊讶,也引发了广泛的讨论,究竟,吉利是如何从一个汽车制造商转变为人工智能领域的重要参与者?本文将探讨吉利在语音合成技术上的创新和突破,以及这对传统企业转型的启示

从传统到现代:吉利的技术转型
吉利的故事始于1997年,当时它是一家名不见经传的汽车制造商,随着全球科技的迅猛发展,尤其是人工智能的兴起,吉利意识到了转型的必要性,从单一的汽车制造商,吉利开始逐步向智能化、数字化的方向发展,其中,语音合成技术的突破成为其转型的关键一环

 


图片来源于网络

 

吉利自主研发的HAM-TTS大模型,名字的全称为“基于token的零样本文字转语音分层声学建模”,在发音准确性、自然度和说话人相似度上表现出色,这一技术的核心价值在于其能显著提升智能座舱的用户体验,通过对语音助手的精准控制,吉利不仅提高了发音准确度,也增强了声音的自然感,这样的变化让用户在使用语音助手时,能感受到更加人性化的交互体验

在这一过程中,吉利的团队不断探索与实验,运用前沿的技术,以期在竞争中脱颖而出,HAM-TTS模型在训练时采用了大量多样化的数据,使得语音合成过程更为精准,数据显示,该模型在字符错误率上下降了2.3%,而风格一致性和整体得分也有10%的提升,这一系列数据不仅证明了吉利技术的成熟,也为其在行业内树立了新的标杆

颠覆行业标准:HAM-TTS模型解析

 

图片来源于网络

 

HAM-TTS模型的成功,不仅仅是技术的胜利,更是吉利重新定义行业标准的体现,在传统的文字转语音(TTS)技术中,通常存在发音准确率低、风格不一致等问题,吉利团队通过创新的分层声学建模方法,成功解决了这一难题

具体来说,吉利在模型中引入了Text-to-LVS预测器,通过文本预测出包含声学和语义信息的隐变量,这一创新使得文本和语音的“对齐”更加精准,显著提高了语音合成的质量,团队在训练过程中引入了对齐器,利用HuBERT特征的对齐,使得模型在推理阶段的表现更加优异

这种对传统技术的颠覆性改进,引发了业界的广泛关注,许多人开始质疑,传统的TTS技术是否已经无法满足日益增长的市场需求?吉利的成功案例无疑为这一问题提供了新的思考方向,随着智能汽车市场的不断扩大,如何在技术上保持竞争力,成为了众多企业必须面对的挑战

 


图片来源于网络

 

科研团队的力量:吉利的幕后推手
在吉利的成功背后,离不开其强大的科研团队,吉利的科学家们不仅深谙行业技术,还具备敏锐的市场洞察力,他们在技术研发过程中,始终关注用户体验,力求在智能座舱的各个方面提供更好的服务

在HAM-TTS模型的开发过程中,团队不断进行用户测试与反馈调整,确保每一个细节都能满足用户需求,在进行语音合成时,他们不仅考虑发音的准确性,还注重语气、停顿和情感等多维度的参数调节,这种细致入微的工作态度,充分展现了吉利对用户体验的高度重视

 


图片来源于网络

 

还有一项重要的举措是,吉利通过引入大数据技术,加大了数据的收集与分析,通过对用户使用习惯的深入分析,科研团队能够更准确地捕捉到市场变化,从而指导后续的技术研发,这种循证的发展理念,不仅提升了团队的研发效率,也为公司的整体竞争力注入了新鲜血液

引领未来:智能汽车的时代来临
随着智能汽车行业的迅速发展,吉利的技术突破为整个产业带来了新的启示,如今,消费者不仅关注汽车本身的性能,更加重视智能化配备带来的便捷与体验,在这样的背景下,吉利凭借其在语音合成技术上的优势,成功吸引了大量用户的关注

 


图片来源于网络

 

吉利的星睿语音模型不仅可以流畅地进行多种语言和方言的语音合成,还能根据用户的需求,智能调节语气与情感,这种灵活性和人性化的设计,让智能座舱的交互体验变得更加生动和自然,这一切的变化,使得吉利在智能汽车市场中逐渐占据了一席之地

但吉利的成功并非偶然,在其背后是对未来科技趋势的准确把握,智能化、数字化将是未来汽车产业的重要发展方向,吉利的探索之路为其他传统企业提供了宝贵的经验和启示:要想在竞争中立于不败之地,必须不断创新、适应市场变化

思考与反思:传统企业的再生之路

 

每日福利更多>>

五菱这是又发现什么新大陆了吗?推出K-car,五菱之光EV曝光 直击进博会|大众汽车集团董事长奥博穆:中国是推动全球汽车产业发展的重要引擎 索尼PS5 Pro首发支持55款游戏,含《战神》等11款第一方游戏 红米K80越级KO,感觉小米15一点都不香了! 小米SU7:21.59万起售,三款车型全面解析及落地成本揭秘 iQOO Neo10 Pro爆料:天玑9400+大电池+塑料中框 现代全新胜达对比传祺GS8:都是性价比超高车型,谁更胜一筹? 本田雅阁新款来袭:一台车为什么能让老司机和年轻人都心动? 新能源暴增83%,各板块销量创纪录,吉利是如何全面爆发的? 再扛销量大旗?拳打赛那、脚踢格瑞维亚行不行? 所至皆坦途!征服野性,驾驭非凡!IT\'S TiME 2.0 重 塑全新普拉多! 标配2.0T 动力,“零百”7.3秒,来看凯迪拉克CT5值得选择吗? 雅阁:2025款锐·T动系列上市,智能化配置升级,值得购买吗? 17.88万元起售,新增2.0L油电混动,2024款丰田亚洲龙怎么样? 宝马S1000RR、S1000R新款上市,M系列同步更新,马力更大了 谷歌:Gemini API用量6个月飙升14倍,明年将升级AI助手 国补最高省2000元!双十一新一波优惠来了,哪些笔记本可闭眼冲? 上汽荣威震撼发布世界冠军版D7 DMH,璀璨官图抢先曝光! 小鹏分体式飞行汽车即将全球公开首飞,年底启动预售 热点城市聚焦:新政满月!上海二手房成交22000套,新房创新高! 一加13更多配置曝光,毫不妥协,真旗舰! 荣耀发布Magic7系列手机,还要重返互联网手机赛道 五菱星光S配置曝光,比亚迪元PLUS应该不是对手 哈弗二代大狗PHEV 省心省力,轻松自驾游 2025款奔驰E级实车到店,增配360度全景影像,有望近期上市 解读一汽-大众迈腾:配2.0T动力+三联屏布局!适合家用的B级车! 丰田亚洲龙:家用商用“结合体”,2.5L混动+长轴距,降至19.68万 丰田汽车2024上半年度全球产量减少7% 85元的7寸安卓平板,支持双4G网络,堪称“追剧神器” 蓝芯科取得壁挂式室内LED显示屏专利,避免对LED显示屏的损坏