作者 | 王瑞平
审校 | 云昭
51CTO读者成长计划社群招募,咨询小助手(微信号:CTOjishuzhan)
(相关资料图)
最近出现的人工智能产品五花八门、功能各异,从文本输出到绘画、视频、音频。这些人工智能工具将艺术创作变得形象生动,展现出用AI描绘的另一个世界。
绘画作为一种熟悉而有趣的表达方式,能够将生活变得色彩斑斓。在创作绘画的同时,我们同样希望将讨人喜欢的静态角色变成动画,使其能够在书页上“走动”,甚至还有书籍和电视剧讲述了这种幻想。
不幸的是,实现这样的效果相当困难!通过创建图形产生运动错觉(如,翻页书)呈现出的效果往往很乏味,新用户使用现有的动画工具又很困难。因此,许多绘画角色仍在纸面上保持静态。
前不久,Meta团队脑洞大开,运用人工智能技术成功将手绘涂鸦变成了栩栩如生的动画。
这款开源AI动画绘图工具(Animated Drawings)是由Meta AI基础人工智能研究团队(FAIR)发布的。该工具用AI技术轻松让各种人物涂鸦变成动画,旨在帮助创作者和开发人员轻松将绘图变成动画产品。
据悉,该项目始于2021年。当时,FAIR的研究人员旨在将计算机视觉变得更直观,将绘画中的人物形象动画化。
普通人能够轻松看懂绘画,但这对于AI模型来讲却没那么容易。
为了让AI模型能够“读懂”绘画,FAIR的研究者首先运用目标检测模型、姿势估计模型和基于图像处理的分割方法快速创建数字版本的绘画。然后,他们使用传统的计算机绘图技术将这些数字版本的绘画变形和动画化。
但是,这种方法具有一定的缺陷,即很难获得训练计算机视觉模型所需规模的人物画集。并且,这些画集还需要被标注好边界框、分割掩码、关节位置等信息,根本不存在这样的数据集!
另一种让AI模型“读懂”绘画的方法是综合创建绘图。这种方法也存在问题,即,生成方法需要大量样本数据来学习、风格迁移方法无法捕捉到绘图与照片的所有细微差别,而且可能做不出像纸张折痕、擦除的线条、强光和阴影等实际绘图中呈现出的变化。
为此,FAIR团队将单张图形生成动画的任务构建为人体图形检测、分割、姿势估计和动画等一系列子任务,并创建出动画绘图演示功能。该功能以公众可访问的网站形态呈现,创作者可在浏览器上公开访问这个动画绘图演示网站,还可以上传他们的绘图,查看或修正一些模型预测,并在不到1分钟的时间内接受到用绘图中的角色创建出的动画。
作为接下来的流程之一,用户可以自由选择允许或不允许Meta保留图像和注释,无论用户作何选择都不会影响该工具未来的使用。研究人员希望通过该功能最终收集到1万张图纸,用来提升模型的功能。
用户对此表现的非常积极。他们在最初的几个月里就上传并同意使用超过160万张图片。而且很多上传的图片根本不是业余画作,而是公司徽标、毛绒玩具、动漫人物、宠物、可动人偶以及人们想要制作动画的各种其他事物的图片。
虽然在演示功能的说明中指定需要呈现出人物形象,但用户还是上传了四足动物、鸟、鱼等其它形象。他们还在社交媒体帖子和演示中的Bug报告中表达,希望获得具有更全面功能的工具。这些功能包括:透明背景、支持不同的骨骼类型、多个交互角色、音效、背景风景和文本叠加等。
感受到大家将绘图变成动画的热情后,Meta决定将动画绘图演示功能使用的模型和代码的开源版本发布出来,激励更多开发者尝试和体验。
如果用户需要将创作出的人物绘画角色变成动画,可以在浏览器登陆Animated Drawings网站。
上传绘图后,用户可以选择调整检测到的边界框、分割蒙版和关节位置,并选择一个动作制作动画。
首先,用户需要上传人物形象绘图,它需要画在一张没有线条与褶皱的白纸上,并保证光线充足。画像中的手臂和腿不能叠放在身体上,同时不能侵权。
然后,你需要调整角色周围框的大小,确保它正好框住角色。下一步,你需要将角色从背景中分离出来,并突出显示它。第四步,检查角色的关节。
最后一步便是用动作捕捉数据将上传的角色动画化。你可以任意选择想让这个角色做出的动作。
要是你想自己下载和运行代码,GitHub提供了指引步骤。
需要注意的是,Meta的动画绘图项目已经在macOS Ventura 13.2.1和Ubuntu 18.04上进行了测试。如果在其它操作系统上安装,可能会遇到问题。
因此,Meta建议先激活Python虚拟环境,比如,用Conda的Miniconda,然后按照下述步骤下载安装。
首先运行如下命令:
然后,你就可以制作动画了。如果一切都正确安装,屏幕上将出现一个交互式窗口。角色、动作、场景等都由配置文件控制。你可以通过改变配置文件,导出MP4视频、动图等不同格式文件。
此外,Meta还训练了人形图形检测器和姿态估计器,并提供了从模型预测自动生成标注文件的脚本。为了让它工作,你需要设置一个运行TorchServe的Docker容器,GitHub上有详细的设置步骤说明。
设置完成后,只需输入如下命令,就能立即将图像转化成动画:
绘画是一种特殊的语言,将你的想象力变成栩栩如生的形象。你可以通过自由的创作记录下天马行空的想法,让别人读懂你的内心世界。而用AI技术将这些静态的图片秒转动画,则将进一步打开想象力之门。
Meta也正是通过将项目代码和业余绘画数据集开源,为更多有兴趣参与这类研究及体验的研究人员及创作者们降低开发门槛,使更多人能够更轻松地探索用AI技术创造出的另一个世界。
Meta在一篇博文中写道:“通过将模型和代码作为开放源码发布,为开发者提供了一个起点,使他们能够建立和扩展该项目,并促进社区内用户的创新和协作。”
https://baijiahao.baidu.com/s?id=1763153584880974511&wfr=spider&for=pc
https://www.engadget.com/meta-shares-ai-model-that-can-detect-objects-it-hasnt-seen-before-210002471.html
作者|王瑞平审校|云昭51CTO读者成长计划社群招募,咨询小助手(微信...
“党的二十大主题是什么?”“党的二十大提出的‘三个不动摇’指的...
市场动态:华南地区BDO市场坚挺上行。多装置检修,现货供应量偏紧,...
中国经济网北京4月25日讯昨晚,观想科技(301213 SZ)发布2022年年度...
4月25日,焦点科技(002315)宣布推出AI外贸助手,为外贸企业提供包括...
挖贝网4月24日,中科蓝讯(688332)发布2023年第一季度报告,公告显...
捷邦科技(301326)04月25日在投资者关系平台上答复了投资者关心的问题。
海新能科(300072)04月25日在投资者关系平台上答复了投资者关心的问题。
达志科技(300530)04月25日在投资者关系平台上答复了投资者关心的问题。
4月25日,受公司营收利润双增影响,截至发稿,乐歌股份涨11 85%,...
投资方为长岭资本。
第一时间提供各大券商研究所报告,最大程度减少个人投资者与机构之...
1、子孙关系。2、秦昭王是秦始皇的曾祖父,这两人的关系其实很清楚...
重大通报:昆明男科医院“排名前三”_昆明男科[正式公布]昆明治疗男...
一、调剂平台中国研究生招生信息网“调剂服务系统”二、调剂系统开...
1、现代人因为工作忙,没有时间自己做饭,大多吃外卖。外卖油盐含量...
美丽乡村日日新——雨湖区红旗村巩固市级文明村成果纪实湘潭日报社...
嘉峪关机务段嘉峪关东运用车间担当兰新线嘉峪关至张掖、嘉峪关至柳...
餐饮店要设置专兼职的监督人员劝导、纠正餐饮浪费现象;电子点餐系...
研究发现:AI聊天机器人让初级员工工作效率提高了35%
所谓AI即人工智能(ArtificialIntelligence),英文缩写为AI。它是...
近日,长距离输氢技术迎来新突破,中石化的“西氢东送”纯氢管道和...
4月20日,陕西数字教育大会在西安交通大学创新港校区召开,榆阳区作...
为集中展示近年来浙江省杭州市开展大众艺术健身活动所取得的成绩,...
中国经济网北京4月25日讯比特矿业周一下跌,截至收盘,该股报2 59...
解答:1、搭配白色裤子,因为白色和橘色都是浅色,会显得优雅;搭配...
中国网财经4月25日讯歌乐股份近日发布的年报数据显示,2022年实现营...
证券时报e公司讯,算力概念股震荡反弹,盛天网络涨超19%,中科曙光...
一、拆迁风险评估之后多久拆迁?1、现行法对拆迁风险评估之后多久拆...
格隆汇4月25日丨协创数据涨16 77%,报28 06元,总市值68亿元。协...
X 关闭
X 关闭