by 司马顿 | 2018年10月23日 下午3:38
今天在机器之心看到这篇文章,数据科学即将迎来“无代码”时代,个人深表赞同。
为什么赞同?因为我们已经这样做了,举例说明吧。
我们内部有大量的图片分类任务,有的时候需要区分一个人的正面、侧面、背面,有的时候需要区分男人、女人、老人、小孩。每次任务的目的通常都不一样,于是每次都要重新写训练代码、找训练数据、训练模型。这个过程比较无聊,而且耗时相当长。
后来我们用到了迁移学习,来解决这个问题。事先用大量的人体图片,训练好一个基准模型,这个模型包含了人体基本特征。新的分类任务进来,在分类目标明确的前提下(比如分类男女还是高矮),组织好训练数据。这个数据不用太多,几十张到几百张就行。然后,在基准模型的基础上,进行迁移学习模型训练。这个过程很快,通常几分钟到几十分钟就可以完成;与之对比,全新训练一个分类模型,需要数个小时。从实践结果看,这样训练出的分类模型,准确度也不差。
在整个过程中,几乎不用写代码,只要组织好训练数据即可。指定用迁移学习训练方式,新的训练数据输入到基准模型进行训练,大幅降低了工作量,提升了效率。
就算自己不搞迁移学习,用百度的easlDL平台,也能飞快完成这个任务,见我之前写过的一篇文档。
以前对线上业务排个序、做个推荐、理解段文本、识别个图片、分析个视频,都需要从头到尾把机器学习的流程走一遍。搞大量的数据,进行清洗、特征转换、降维、标注,然后手写模型、调参、训练、迭代,过程慢悠悠,心里空荡荡。
现在不同了,在迁移学习和AutoML帮助下,这些过程可以大幅节省。利用已有的模型成果,使用少量数据来训练新的模型。或者只要有数据,在神经架构搜索(NAS)技术帮助下,直接生成神经网络结构,连算法都免了。
从此,搞AI工作不用写代码。无码,是宅男最爱呀。心中无码,女神遍天下。
文中放的是油管上知名主播“爱酱”的视频,她是AI创作的小萝莉,萌萌的粉可爱,吸粉无数哦。今后,也许你也可以轻松创作这样可爱的萝莉了。
Source URL: https://smart.postno.de/archives/617
Copyright ©2025 司马顿的博客 unless otherwise noted.