文 | 脑极体
那些学历很高的博士都去哪儿了?
他们在地里,厂里,矿里呢。
(资料图)
中科院的林博士,我见过他两次。
第一次是 2020 年,某 AI 精英培训班的开学典礼。当时,林博士对 AI 的了解,还停留在 " 深度学习的皮毛 ",他调用平台的机器视觉模型,开发了一个识别动物的模型,他说:" 可以识别的种类还比较少,我来也想看看其他学员都用 AI 做些什么工作,跟大家多学习。" 林博士那次介绍这个 AI 产品时,还有些没底气。
第二次是 2022 年,在一个普通的会议室采访间,林博士的言谈内容,变得自如和丰富了很多。
" 之前的那个生物识别应用,这几年已经多出了好多个模型,扩展到了哺乳动物、两栖爬行、昆虫科一级、蝴蝶种一级的识别," 他说," 我们还用 AI 做了别的事,一个是野外生物的图像采集和自动化识别,一个是通过声纹识别来进行野外动物保护,目前设备已经弄好了。我们还支撑别的企业去做 AI 商业化应用,比如农业病虫害的识别 "。
两年时间,林博士从 AI 新手成长为 AI 熟手,也从一个坐在电脑前搞研究的学者,多了很多上深林、下农田的经验。他眼中的 AI,倒映着智能中国的上限与纵深。
今天的故事,是科研领域的博士,怎么从零开始用 AI、做 AI。
研究所里的 AI,有什么不一样?
科研领域的智能化,与工农商等行业既有相同点,也有不同点。
相同点在于:1. 缺人;2. 缺数;3. 缺场景。
科研领域汇聚了大量高学历人才,但依然缺少能将 AI 与细分学科相结合的复合型人才。就拿林博士来说,他本身是信息学专业的,因为生物研究要用到计算机分析等信息技术,才加入了中科院下属的动物研究所,对于深度学习、图像识别、声纹识别等人工智能技术,他也要从头学起,迭代自己的知识体系。
此外,研究型机构大多有一定的数据积累,但也分领域、分专业甚至分物种。比如林博士想做的物种识别、鸟类声纹识别等 AI 应用,很多珍稀动物,别说语音资料,连野外活动的图像,数据库里一共都没几张,而缺少充足的数据,AI 很难发挥作用。
还有,科学研究的哪些课题、方向能用到 AI,这也是一个需要科学家们发挥 " 主观能动性 " 去摸索的东西。林博士提到,很多科学研究中已经有很成熟的计算工具了,要用到 AI 肯定是要从一线科研人员开始推动,这就需要自己有一定的想法,他说:" 所以我听说有这个深度学习人才培训,就带着我的课题主动来报名了,希望能顺利毕业。"
当然,AI+ 科研也有其特别的地方。
比如,特别没钱途。
第一次见面,我好奇地问," 当下 AI 跟生物的碰撞多不多?" 林博士笑言:
"AI 在医学领域应用的很快,但在生物识别方面就没有那么好,可能跟动物保护这种基础性研究的商业价值不大有关系,投入上有一定的滞后性。"
玩笑归玩笑,AI 与科研的结合也特别重要。
林博士的经历证明,基础研究领域的 AI 创新一旦成长起来,可以带来产学研用的一系列联动效应。
2020 年,林博士刚刚做出了一款识别动植物的科普类 App,集成了计算机视觉技术和他们单位的动植物百科资料,方便一些动物爱好者、野外观测调查员以及小学生和家长们使用。
中国领土广阔,专家考察有一定的时间线,比如每五年一次,很可能就会错失某些物种的观察机会,导致采样到的数据是有偏差的。而且生物领域的分类学家、人才也处于萎缩状态,越来越少人愿意从事这样艰苦的野外工作,所以全靠研究者和野外工作者去采集和分类,是非常不现实的。
通过智能技术的创新应用,聚集起更多数据合作伙伴,发动机构乃至广大用户一起参与进来,对于生物保护和研究的开展很有帮助。
而这样一个纯公益的工作,随后也凝聚起了很多研究机构、公益组织以及企业 / 产业界的关注。
林博士告诉我,开发完那个 App 之后,很多类似的国际动物保护机构跟他们建立了很好的联系,他们输出技术,而对方将获取的生物数据资料反馈给他们,让他们获得了几十万的影像数据,其中很多都是新增的观测点位,相当于给国家节省了好多科研经费。
可持续的数据获取机制,对于后续科研任务的开展是非常重要的。
除此之外,他们还吸引到了一些商业化项目方,前来寻求合作。
比如有企业知道他们有这个技术,找到他们想开发一种害虫识别的系统,恰好林博士所在的单位本身也承担着病虫害防治工作,有做好粮食安全保障的职能。于是双方一拍即合,开始搭建病虫害的数据库,进行识别算法的开发。
相比跟经济价值更近的工农商业,科研领域的智能化看起来好像没那么紧迫,却有着 " 创新发动机 " 的作用:影响的不是一个人、一家企业,而可能是一个行业(比如上文提到的农业)、一个群体(比如科普教育)乃至一个国家(比如学科人才建设)。
从象牙塔到农田:一个博士的脚步
此前报道中的电力工人、水厂员工都是 AI 应用末端环节的一份子。
而借助林博士的脚步,我们可以看到,一种 AI 能力是如何诞生的又如何抵达应用末端。
第一步:从零做数据。
接收到企业提出的识别病虫害的需求之后,林博士发现,数据就是一个很大的挑战。
从生物学的角度,害虫也有很多种,一种害虫的发育过程中还有很多种形态,从虫卵、弱虫、幼虫、成虫的发育状态都不同,在图像分类过程中就属于不同类别,如果是外行人来做,根本做不明白也没有一个成型的数据库。
所以林博士和团队,必须从电脑桌前走到地里,去实地采集不同阶段的图像,确定病虫害不同发育阶段的形状特征,为后续模型的精准识别打下基础。
第二步:跟农业专家深入交流。
不同地区的病虫害可能并不相同,里面涉及到很多非常专业的知识点,比如北京郊区的番茄有哪些常见的病虫害?发现害虫后会对接怎样的防治措施?提供什么药物?这都要深入到大棚里,跟当地的植保专家以及长期从事一线生产的农民们进行交流,这样才能保证后期打造的 AI 系统,能够提供从病虫害识别到防治指导的全套工作。
第三步:模型开发与调优迭代。
林博士和同事们基本都是信息学专业,并不是深度学习算法工程师出身,而农业项目的模型迭代又很快,一批图像采集完了之后,马上就要迭代一批模型,为了精准识别不同作物,还要开发不同的模型,这样模型很多,开发和迭代工作量很大。
林博士表示,科研工作中可能很看重 AI 开发框架的灵活性、可扩展性、先进性等,比如为了发 paper 便于同行复现,大家更倾向于使用 TensorFlow、PyTorch 这样的海外平台,而真正在开发产业用模型时,我们更看重的是平台的易用性,以及面向应用的工业化能力是不是很简单易用,有没有已经训练好的性能不错的模型。
因为底层的技术手段、理论方法,国内外开发平台都是一样的,也都是开源的,没什么区别,但容不容易训练,容不容易部署,能不能工业性地批量生产(模型),这些问题的答案对产业智能化很重要。
目前,由林博士及团队支持的该农业病虫害应用已经在北京落地了,这也是北方地区第一款病虫害识别的 App。
为什么做这个项目?林博士及团队的出发点和商业公司的想法就不太一样——一方面是企业 / 农户有需求;另一方面是为了帮助新农人。
" 现在大量的新型农业生产者,比如年轻一代," 林博士提到," 他们没有熟练的生产经验,也不依赖上一辈传授的经验,而是更依赖从互联网获取的信息。这时候我们给他提供一个工具—— AI 识别,慢慢地他们也会成长为有经验的生产者。"
以往《打卡智能中国》的主角,电力工人放飞的无人机,水厂员工日常使用的智慧系统,这些 AI 工具背后就是无数个林博士。
学员?导师?研究员?开发者?一个 AI 人的身份转换
第一次见到林博士,他还是一个带着课题等待被评判的 "AI 新手学员 "。
第二次见到他,已经是国内某 AI 开源社区的技术专家了。
林博士平时还会承担一些新手指导、开发经验分享等任务,把自己的数据和模型开源放到平台上,让开发者和学生用户有实践和练手的机会。
培养多一点 AI 人才,这种 " 利他 " 的思维,好像就刻在这位学者的脑子里,不用犹豫和思索,自然而然地就去做了。
AI 人才需求量大、缺口大,已经是公认的事实,也成为人工智能产业进一步繁荣发展的限制。
AI 人才的培养难,一是因为技术新,相较于理数生化等传统学科,以及计算机这样的成熟学科来说,AI 本身是一门新兴技术,还在不断更新迭代,没有完善的人才培养模式和课程体系;二是交叉性强,AI 是一门应用型技术,要求跟产业紧密结合、实践落地,仅靠学校教育是无法满足 AI 复合型人才的培养需求。
十四五规划中提出,人工智能行业要形成产学研用深度融合的技术创新体系,连通企业、高校、研究院所、政府等创新主体。
在 AI 生态里," 产学研用 " 是分层的,每一层都承担着各自主要的创新任务,但分层不代表割裂,各层还要紧密联动,拧成一个创新链条。
" 林博士们 " 就成了那个游走在各层的关键角色:
在产业中,他们是 AI 创新的开发者;
在高校人才培养中,他们是那个给学弟、学妹指导的前辈;
在研究中,他们是将 AI 技术与科学探索相结合的先行者;
在应用环节,他们会主动去贴近一线使用者,让 AI 工具能变得更好用。
" 谈笑有鸿儒,往来无白丁 " 这就是今天的 AI 学人,既有身处象牙塔兼济天下的理想情怀,又有身先士卒深入产业的行动能力。
有一个工业大学的老师曾告诉我,要把 AI 研究做到工厂里,这和林博士把 AI 做进农田里,有异曲同工之妙。
这些学者拥抱 AI 的经历,让我深切的感受到:AI 既是一个专业,也不是一个专业。AI 将更多专家和学者拉进 AI 的世界," 产学研用 " 的闭环加速转动,才能持续打开 AI 的上限和想象空间。
大鹏之动,非一羽之轻也,多元人才的合力,才能托举起智能中国。
标签:
精彩推荐
plac文件可以转为mp3文件吗,plac文件转mp3这个很多人还不知道,现在让我们一起来看看吧!1、有时下班躺在床
警嫂吴薇(化名)身患癌症,因担心成为丈夫拖累提出离婚,被断然拒绝。她曾在日记里写下:“我想我应该...
大庆西站火车时刻表,大庆西站这个很多人还不知道,现在让我们一起来看看吧!1、大庆西站现在无法办理托运。
十月怀胎,一朝分娩,在满心欢喜迎接小生命降临的同时,母乳喂养成了最关注的问题。5月20日是第33个“全国
1、艾酒是一种有茴芹味的高酒精度蒸馏酒,主要原料是苦艾(wormwood)药草(即洋艾(Artemisiaabs
千呼万唤始出来,2023年5月18日,比亚迪官宣,全新汉DM(参数|询价)系列正式上市,作为比亚迪旗下有口皆碑的
你们好,最近小活发现有诸多的小伙伴们对于卢克每日怎么破防,卢克每日怎么打这个问题都颇为感兴趣的,今天
1、龙头等选九牧的,我从装上就没换过,就是买的时候感觉有点贵,不过确实好。2、省的花一百多买个杂牌的,
简介:本篇为奇葩小国之东帝汶。参考资料:夏威夷大学出版社1995年出版《十字路口的东帝汶:一个国家的锻造
国任保险是中国大陆的一家财产保险公司,总部位于北京市朝阳区。公司以“服务、创新、诚信”作为经营理...
1、维持人体消化道和呼吸道的润滑,从而促进胆固醇的排泄,减少在动脉壁上的沉积,维持血管的弹性。2、吃黄
1、“落”的基本意思是留下,遗漏,比如把东西留下,落在后面。“跌”字引申为倒下的意思,如倒下。2、...
一般手机微信和微信网页是同步的,手机微信收到新消息,网页微信里面也会显示。如果不同步,可能是网页登录
在BLG击败T1赛后,LPL英文流解说Kitty更推晒出了和BLG上单Bin的合照,并且配文:和猛男Bin的合照!(外网频
1、确界原理(supremumandinfimumprinciple)是刻画实数完备性的命题之一。2、
导读:最近很多玩家都在关注迷失医院这款手游,想知道具体的公测时间,迷失医院会经过封测、删档内测、不删
5月20日,加加食品披露投资者关系活动记录表。加加食品创建于1996年,2012年1月在深交所上市,是公司所在地
5月20日,国羽与日本的苏迪曼杯半决赛打响,主场作战的12冠王出师不利,混双新组合冯彦哲 黄东萍打满3局输
本届“520”成都生活节以“喜迎大运成都有礼”为主题,横跨5月至6月,“牵手”23个区(市)县,以及重庆...
作者|谢明宏编辑|李春晖上世纪八九十年代,香港娱乐盛极一时。那会儿的香港小生,是可以统一中国乃至亚洲观
早期统计,《速度与激情10》北美周五首日收获2700万美元。较2021年前作《速9》所取得的2986万美元进一步下滑。
大家好,我是正在分配资源的何二维一。今天的攻略文章应不少朋友的要求,给大家来简单说说第八魂环可以考虑
GSD统计了4月欧洲的游戏市场数据。
赏各种绣球,玩亲子跳绳、飞盘、投壶,观看蚯蚓科普片,参加森林探秘科普游,爱心义卖……今天,滨江森...
IT之家5月20日消息,当贝投影仪F6开启预售,5月31日20:00正式开售,首发价6799元。当贝F6采用10片全光学超
资讯News
05-22
05-22
05-22
05-22
05-22
05-22
05-22
05-22
05-22
05-22
05-22
05-22
05-22
05-22
05-22
05-22
08-28
06-20
11-03
11-03
聚焦Policy
当好农民工的“护薪人” 近日,罗某等7名农民工在收到被拖欠的工资后,纷纷打电话向江西省南昌市...
“通讯录里所有人都知道我欠钱了” □ 本报记者 韩丹东 □ 本报见习记者 张守坤 ...
大连宝马车撞人案肇事司机被判死刑 本报讯 记者韩宇 10月29日,辽宁省大连市中级人民法院一审...
医院财务迷上网络赌博输光5000万元公款 □ 本报记者 马维博 □ 本报通讯员 汪宇堂 曹...
辊环车削 雕琢毫厘(工匠绝活) 【绝活看点】 23年来,雷虎始终扎根一线,改进钢材轧制工艺...
交警严查超标电动自行车挪用“白牌” 截至昨晚6时,处罚电动自行车违法行为共计6585笔;下一步将...
明起寒潮来袭 北方气温普降10℃以上 中央气象台预计,本周日北京平原地区最低气温降至-4℃左右...
多种蔬菜价格降幅达五成 包括菠菜、蒿子秆等 预计本月中旬蔬菜恢复供需平衡 本报讯(记者...
北京周日最低气温或达-4℃ 本报讯(记者 赵婷婷)北京青年报记者昨天从中央气象台获悉,新一股...
昌平一家四口确诊新冠肺炎 天通北苑第二社区升级为中风险地区 朝阳两涉疫校区及16所学校停课 ...