手机版
位置:筑能财经 > 热点 >

人工智能训练师: 让机器更“懂”人类

来源:人民网-人民日报海外版 | 2023-07-31 10:11:43

打开电脑,将采集的风声、雨声、溪流声等声音数据输入,“清洗”掉夹杂其间的噪音,对助听器数据模型进行“训练”,测试模型在真实场景的灵敏度……伴随着手指敲击键盘的“啪嗒啪嗒”声,腾讯天籁实验室人工智能训练师付聪一天的工作就此开始。

近几年,随着人工智能技术不断发展,这个被称为人工智能训练师的职业逐渐壮大。作为“数字职业”之一,人工智能训练师的出现,加速了人工智能由技术研发走向行业应用的过程,将产生较高的经济价值和社会价值。


(相关资料图)

为模型不断“喂”数据

每次出门时,付聪总会在耳朵上戴一个大“耳环”。

这个“耳环”其实是一个测试版的助听器。“耳环”里的声音各式各样,有呼呼的噪声,有尖锐刺耳的吵闹声……这些经过助听器放大后产生的噪声,是很多佩戴助听器的听障人士长期面临的困扰。

付聪和他的团队正在尝试利用算法设计、通过人工智能技术“训练”数据模型,让助听器更加“智慧”地降低噪声,让听障人群听得清、听得懂、听得舒服。

付聪解释说,助听器数据模型很小,因此需要针对不同场景进行优化,很多场景充满挑战,“比如一个听障人士在餐厅吃饭,周围有很多人说话,他想跟对面的人聊天,四周声音特别嘈杂,作为一个正常人都可能听不清楚,更何况一个有听力障碍的人?我们希望利用模型,把需要的声音提取出来,降低噪声,帮助更多听障人群”。

理想很丰满,但是实际的模型算法研发过程却像是一场反复进行的“战役”。

模型的研发过程大致分为以下几步:数据采集、数据“清洗”、模型训练、场景测试、调整算法,经过几次迭代之后再测试、调整,“如果测试结果不理想,需要把这个过程再走一遍,直到得到最优效果”。付聪说。

数据采集要有针对性。为了让模型更“聪明”,需要针对不同场景采集各种特殊数据。付聪和团队成员不仅需要到早晚高峰的地铁、热闹喧天的餐厅、人来人往的马路等场景,采集数百个小时的声音数据,还要戴上助听器体验这些声音的差别,“比如风声,正常人听到是呼呼声,但戴上助听器以后,是很吵的噗噗声,像是去KTV唱歌,声音使劲砸到麦克风上”。道路骑行、海边风浪……为了采集各种风噪数据,付聪录制了多种场景的风声。

数据“清洗”是将不需要的数据“洗掉”。付聪举了一个例子——风声,真实场景下会夹杂汽车鸣笛、人交谈等声音。在整理时要把这些数据剔除出来,保留一个比较纯粹的风声,这样模型才会“认识”风。

模型训练是将“清洗”好的数据“喂”给模型。除了采集的特殊数据,付聪和他的同事们还会加入诸如世界各国的语言和一些非语音声音等数据,“基本涵盖了人们生活中遇到的所有噪声和语音”。

和人类不同,人工智能模型在训练过程中,不会疲惫、烦躁、发脾气,它们的“智慧”取决于模型参数、训练策略、数据量等。“它们就像一个‘孩子’,会越来越‘聪明’,识别到越来越多的声音,我特别有成就感。”付聪说。

考验耐心、细致和忍受力

模型训练完成后,并不意味立刻能应用到听障人群的助听器上,还要经历较长时间的迭代、调整过程。

比如,为了让听障人群适配到合适的助听器,传统方式是患者反复到线下的验配店去试戴,过程繁杂。付聪解释说,一般情况下,根据发病原因不同可以将听力下降分为三类:感音神经性、传导性、混合性耳聋;根据听力下降的程度不同,分为轻度、中度、重度及极重度耳聋。针对不同的类型,助听器的适配方式有所不同。

有没有可能把适配过程搬到“线上”,利用人工智能算法和深度学习能力,让听障人群在线上就能做准确的听力验配?带着这个疑问,付聪开始研发适配算法。他将这个过程比喻为做应用题,需要查询国内外文献、检索现有方案,根据具体的使用环境,利用现有知识开展合理想象、设计实验、寻找答案。

这个过程考验人工智能训练师的耐心、细致。在测试助听器音质时,不同的佩戴方式,对应不同的测试结果。付聪和同事需要以“N×N”排列组合设计不同的佩戴方式,并且不断重复试验,来研究其对音质产生的影响。

这个过程十分考验人工智能训练师的忍受力。“一个人工智能训练师的基本素养,就是强迫自己听很多次刺耳的声音。”付聪表示,这是因为训练师需要定量衡量听障患者能正常听到的声音极限点,而这些声音的分贝数是正常人耳难以忍受的,“很多时候恨不得把耳机摔掉。经过一天测试,整个脑袋都感觉疼”。

经过不断迭代、调整,内置了算法的助听器终于完成了。最让付聪难忘的是他们第一次到广东韶关捐赠产品,他们把助听器挨个交到听障老人手上,开机、戴设备、调整增益……“虽然我对模型很有信心,但当时还是感觉心提到了嗓子眼,因为在此之前,老人们是无法正常交流的。”付聪说。

他小心地询问一个老人:“您能听到我在说什么吗?”

“可以了。”老人缓慢而又坚定地从口中说出3个字。

“那时候我觉得,我们做的这个事情挺有意义的。”付聪说。

用技术解决人类需求

人工智能训练师是一个需要忍受孤独的职业,因为他们大量的时间是在设计方案、写代码、采集数据、训练模型中度过的。

“我战胜孤独的秘密是兴趣。”付聪的专业是通信,其中很多课程和信号处理相关,他平时比较喜欢音乐,因此就将自己的兴趣和专业、工作结合起来,聚焦音频领域,大学毕业后参与了很多有关音频信号处理的工作,经历了音频算法从传统算法到人工智能算法,再到大规模深度学习的各个阶段。

在付聪看来,人工智能技术是一个很好的工具,目的是将人类从很多脑力劳动中解放出来,用规模化的方式去替代目前成本较高的个体劳动。对整个社会而言,这是一种生产力的进步,有着巨大的社会价值和商业价值。

成熟的人工智能技术是什么样?付聪认为需要经过3个阶段:一是感知智能,核心在于模拟人的视觉、听觉和触觉等感知能力,比如人脸识别、语音识别等;二是认知智能,具有人类思维理解、知识共享、行动协同或博弈等特征,“能够真正理解人在说什么,根据一些提示,提供相对完整的回答”;三是行为智能,也就是像自动驾驶一样,真正可以在物理世界发挥作用。

达到这样的目标,需要对人工智能模型不断进行训练。付聪表示,首先需要针对问题准备足够多的数据,“多到尽量涵盖解决这个问题时所遇到的所有情形”;其次需要设计很好的算法,并根据用户反馈不断优化。

“人工智能技术领域日新月异,要求人工智能训练师有广阔的视野、深厚的人文情怀和社会责任感,用业界最新想法、理念和正确的伦理观来帮助人类解决生产生活中遇到的问题。”付聪说。

标签:

精彩放送

新闻资讯

  1. 市属国企强强联手,打造住有宜居体育健康服务生态示范标杆
  1. IVE张元英三星发布会后,使用苹果手机,引发了韩国网友们的争论
  1. 学好初中数学的方法和技巧 学好初中数学的方法和技巧
  1. photoshop滤镜下载(photoshop滤镜插件下载)
  1. 北控男篮阵容升级,闵鹿蕾正式上任取代马布里,两大新援加盟!
  1. 逆水寒手游镜湖流珠位置大全
  1. attach importance to(attach)
  1. 怎样设置表格公式加或减_表格公式加减乘除怎么设置
  1. ATP500德国汉堡站:张之臻止步四强,收获180分、98215欧元
  1. 天津经开区严阵以待迎战“杜苏芮”
  1. “预防先行 共话中老年健康发展” 2023老年健康宣传周媒体科普沙龙顺利开展
  1. 主人冲刺救落水女童 辅警洪水中托举女童获记一等奖 基本情况讲解
  1. 厦门辖区高速公路解除交通管制
  1. 老坑紫罗兰翡翠值钱吗
  1. 拆迁纠纷该怎样维权
  1. 起名字大全男孩(男孩名字大全)
  1. 手绘“绿书签” 护苗正当时
  1. 河南备战强降雨丨强降雨易引发城市内涝,这些高风险点请避开
  1. moto G14产品详情揭晓,将于8月1日正式发布
  1. 经济日报:稳步推动中小金融机构改革化险
  1. 福州生鲜卖场正常营业线上配送有序恢复 供应量足价稳
  1. 台风黄色预警!安徽11市将迎大雨到暴雨,局部大暴雨
  1. 瞰汉中|古韵悠悠展新风
  1. 青春不散场 精彩正当时(行走蓉城)
  1. 竹竿的拼音组词(竹竿的拼音)
  1. 上天无路入地无门的意思(怎么理解上天无路入地无门)
  1. 浙江省温州市2023-07-30 10:28发布暴雨黄色预警
  1. 河北发布地质灾害气象风险预警!保定、石家庄、邢台、邯郸部分地区发生崩塌、滑坡、泥石流等地质灾害风险很高
  1. 海南郊区房价多少钱一平(海南郊区房价多少钱二手房)
  1. 闻“汛”而动 石家庄市城管系统全力做好防汛工作
  1. 友谊之桥打通发展之路(共创繁荣发展新时代)
  1. 榕台中小学生共同体验制作福州软木画
  1. 福建省终止防台风应急响应和防暴雨应急响应
  1. 郭言:“去风险”威胁全球产业链稳定
  1. 武威酒店几星级(武威酒店)
  1. 载近3000辆汽车货轮在荷兰海域起火,1死多伤,宝马等多家车企回应!
  1. “不是我能,我是妈妈!”八旬老母亲用坚强撑起一个家
  1. 黑土地农家书屋飘“书香”:吉林乡村筑起“文化粮仓”
  1. 【光明网评】中国正能量,吹响团结奋进最强音
  1. 养殖+科研+休闲 山东烟台探索海洋牧场多元发展新模式
  1. 热评丨“到成都街头走走看看”,城市漫步因何成为爆款
  1. 预计“卡努”逐渐向浙江沿海靠近 最大强度可达强台风级
  1. 创意微视频 | 成都十二时辰
  1. 纵享“嗨啤”快乐,感受盛夏激情
  1. “逐渐消失”的陆生触动台湾教育界,苑举正呼吁台当局处理歧视性政策
  1. 《长相思》热播,杨紫回应“五官乱飞”,网友:说得很好
  1. 网络直播带“赌”,判刑两年罚金五万
  1. 人民网评:全力应对“杜苏芮”,把灾害损失降到最低
  1. “匠心筑梦技能报国”——青海代表团参加第二届大国工匠创新交流大会
  1. 手球还是头球❓浙江队疑似禁区手球 主裁拍头&球员指头示意是头球
  1. 落星飞鸿和北冥巨鳞哪个好用(落星飞鸿加多少伤害)
  1. 脱贫人口务工规模超年度目标近240万人
  1. 巴萨3-0!疯狂的国家德比:8黄26犯,皇马4中框,冲突不断
  1. 工程分包和工程劳务分包的区别(工程分包与劳务分包有区别吗)
  1. 福特汽车在全球电动汽车市场的主导地位正在不断扩大
  1. 每日精选:哈尔滨看男科哪里的医院好[实力专长]哈尔滨哪家医院治性功能好
  1. 近亲 字幕 在线 中文字幕近亲
  1. 中国最东端的乡级岛屿打造最美乡村路
  1. 第三届长三角体育节电子竞技赛在湖州开战
  1. 二维码防伪标签什么价格(二维码防伪扫描)
  1. 湖人一球员身高突增,可与浓眉搭档双塔,八村塁首发位置不稳
  1. 烧香拜佛的讲究和忌讳有什么_烧香拜佛的讲究
  1. 快船不愿为哈登送走曼恩?斯诺:只是说辞 说明他们对交易不积极
  1. 亮绩亮诺亮牌!知识城全面发起冲刺
  1. 台风“杜苏芮”已造成福建88万余人受灾
  1. 大学不再区分一本和二本,高考填志愿时依旧需注意,考生提前了解
  1. 哈利波特魔法觉醒学年挑战2过关用什么卡组
  1. 北京顺义地图(北京顺义地图最新版2023年)
  1. 被中介恶意扣工资,这边只有合同照片
  1. 数码大师2010破解版下载安装(数码大师2010破解版)
  1. 天津国际邮轮母港迎三年来首批旅客
  1. 泗阳县委编办:系统化赋能 打通经济发达镇培育“神经末梢”
  1. 原神4.0前瞻直播3大问题引热议!雷神钟离夜兰紧急复刻,老米真着急了!
  1. TES败给LNG后,官博炸了!粉丝怒斥wayward:什么时候退役?
  1. (成都大运纪事)成都大运会艺术体操开赛 3天将决出8金
  1. 台风“杜苏芮”登陆福建晋江
  1. 神态描写的句子(神态)
  1. 续写“北戏南下 南戏北传”佳话!石家庄人的家乡戏在广州唱响
  1. 张艺凡施柏宇拍亲嘴吻戏惹争议 节目组发文回应
  1. 直击防抗台风“杜苏芮”:福州市民开展灾后自救
  1. 截至29日17时,全省682个站点达到暴雨级别,78个站点达到大暴雨级别
  1. 四大湾区、10座城市大PK!粤港澳大湾区交通网络最强劲,深圳连续两年稳居第七
  1. 宁波天安集团股份有限公司(关于宁波天安集团股份有限公司简述)
  1. 汉中一地百亩花海惊艳盛放,拍照打卡超出圈!
  1. 东方甄选直播被暂停服务 原因成谜 东方甄选否认是抖音的原因
  1. 宿迁:服务以“变”求“便” 幸福直达“家门口”
  1. 滕王阁门票被指“五花八门”,景区回应
  1. ​绝境重生!中国女足1-0海地女足获首胜
  1. 刀光剑影拳来腿往!成都大运会武术比赛现场精彩纷呈
  1. 中欧班列运行品质和效率不断提升 运输服务网络基本覆盖亚欧全境
  1. 双清区:“清合力”党建引领文旅融合启动乡村振兴“新引擎”
  1. 考研英语阅读笔记 2013 text3 普通 英一
  1. 2023厦门工博会“聚焦新工业” 吹响“智造”集结号
  1. 官方:尤文正式与荷兰前锋伊哈塔伦解约
  1. 【西青区预警信息发布中心】西青区气象台于2023年07月29日15时00分发布暴雨黄色预警信号
  1. 高质量发展调研行|生产向稳 转型向绿 投资向新——山东绿色低碳高质量发展一线见闻
  1. 12款途观发动机链条多久更换一次好(12款途观发动机链条多久更换一次?)
  1. 高质量发展调研行|记者手记·精致城市看“精”“智”
  1. 云南省怒江傈僳族自治州泸水县2023-07-29 14:58发布暴雨橙色预警
  1. 富拉语_关于富拉语介绍