Meta发布AI开源大作，将涂鸦变成动画原创精选

您当前的位置：首页 >> 要闻 > >> 正文

来源: 选型助手时间：2023-04-25 11:39:26

作者 | 王瑞平

审校 | 云昭

51CTO读者成长计划社群招募，咨询小助手（微信号：CTOjishuzhan）

(相关资料图)

最近出现的人工智能产品五花八门、功能各异，从文本输出到绘画、视频、音频。这些人工智能工具将艺术创作变得形象生动，展现出用AI描绘的另一个世界。

绘画作为一种熟悉而有趣的表达方式，能够将生活变得色彩斑斓。在创作绘画的同时，我们同样希望将讨人喜欢的静态角色变成动画，使其能够在书页上“走动”，甚至还有书籍和电视剧讲述了这种幻想。

不幸的是，实现这样的效果相当困难！通过创建图形产生运动错觉(如，翻页书)呈现出的效果往往很乏味，新用户使用现有的动画工具又很困难。因此，许多绘画角色仍在纸面上保持静态。

前不久，Meta团队脑洞大开，运用人工智能技术成功将手绘涂鸦变成了栩栩如生的动画。

这款开源AI动画绘图工具（Animated Drawings）是由Meta AI基础人工智能研究团队（FAIR）发布的。该工具用AI技术轻松让各种人物涂鸦变成动画，旨在帮助创作者和开发人员轻松将绘图变成动画产品。

据悉，该项目始于2021年。当时，FAIR的研究人员旨在将计算机视觉变得更直观，将绘画中的人物形象动画化。

1、让AI模型读懂绘画

普通人能够轻松看懂绘画，但这对于AI模型来讲却没那么容易。

为了让AI模型能够“读懂”绘画，FAIR的研究者首先运用目标检测模型、姿势估计模型和基于图像处理的分割方法快速创建数字版本的绘画。然后，他们使用传统的计算机绘图技术将这些数字版本的绘画变形和动画化。

但是，这种方法具有一定的缺陷，即很难获得训练计算机视觉模型所需规模的人物画集。并且，这些画集还需要被标注好边界框、分割掩码、关节位置等信息，根本不存在这样的数据集！

另一种让AI模型“读懂”绘画的方法是综合创建绘图。这种方法也存在问题，即，生成方法需要大量样本数据来学习、风格迁移方法无法捕捉到绘图与照片的所有细微差别，而且可能做不出像纸张折痕、擦除的线条、强光和阴影等实际绘图中呈现出的变化。

为此，FAIR团队将单张图形生成动画的任务构建为人体图形检测、分割、姿势估计和动画等一系列子任务，并创建出动画绘图演示功能。该功能以公众可访问的网站形态呈现，创作者可在浏览器上公开访问这个动画绘图演示网站，还可以上传他们的绘图，查看或修正一些模型预测，并在不到1分钟的时间内接受到用绘图中的角色创建出的动画。

2、用户：期待更全面的AI绘图工具

作为接下来的流程之一，用户可以自由选择允许或不允许Meta保留图像和注释，无论用户作何选择都不会影响该工具未来的使用。研究人员希望通过该功能最终收集到1万张图纸，用来提升模型的功能。

用户对此表现的非常积极。他们在最初的几个月里就上传并同意使用超过160万张图片。而且很多上传的图片根本不是业余画作，而是公司徽标、毛绒玩具、动漫人物、宠物、可动人偶以及人们想要制作动画的各种其他事物的图片。

虽然在演示功能的说明中指定需要呈现出人物形象，但用户还是上传了四足动物、鸟、鱼等其它形象。他们还在社交媒体帖子和演示中的Bug报告中表达，希望获得具有更全面功能的工具。这些功能包括：透明背景、支持不同的骨骼类型、多个交互角色、音效、背景风景和文本叠加等。

感受到大家将绘图变成动画的热情后，Meta决定将动画绘图演示功能使用的模型和代码的开源版本发布出来，激励更多开发者尝试和体验。

3、将手绘人物变成动画

如果用户需要将创作出的人物绘画角色变成动画，可以在浏览器登陆Animated Drawings网站。

上传绘图后，用户可以选择调整检测到的边界框、分割蒙版和关节位置，并选择一个动作制作动画。

首先，用户需要上传人物形象绘图，它需要画在一张没有线条与褶皱的白纸上，并保证光线充足。画像中的手臂和腿不能叠放在身体上，同时不能侵权。

然后，你需要调整角色周围框的大小，确保它正好框住角色。下一步，你需要将角色从背景中分离出来，并突出显示它。第四步，检查角色的关节。

最后一步便是用动作捕捉数据将上传的角色动画化。你可以任意选择想让这个角色做出的动作。

4、自己运行开源代码

要是你想自己下载和运行代码，GitHub提供了指引步骤。

需要注意的是，Meta的动画绘图项目已经在macOS Ventura 13.2.1和Ubuntu 18.04上进行了测试。如果在其它操作系统上安装，可能会遇到问题。

因此，Meta建议先激活Python虚拟环境，比如，用Conda的Miniconda，然后按照下述步骤下载安装。

首先运行如下命令：

然后，你就可以制作动画了。如果一切都正确安装，屏幕上将出现一个交互式窗口。角色、动作、场景等都由配置文件控制。你可以通过改变配置文件，导出MP4视频、动图等不同格式文件。

此外，Meta还训练了人形图形检测器和姿态估计器，并提供了从模型预测自动生成标注文件的脚本。为了让它工作，你需要设置一个运行TorchServe的Docker容器，GitHub上有详细的设置步骤说明。

设置完成后，只需输入如下命令，就能立即将图像转化成动画：

5、写在最后AI技术开源，激活创造力

绘画是一种特殊的语言，将你的想象力变成栩栩如生的形象。你可以通过自由的创作记录下天马行空的想法，让别人读懂你的内心世界。而用AI技术将这些静态的图片秒转动画，则将进一步打开想象力之门。

Meta也正是通过将项目代码和业余绘画数据集开源，为更多有兴趣参与这类研究及体验的研究人员及创作者们降低开发门槛，使更多人能够更轻松地探索用AI技术创造出的另一个世界。

Meta在一篇博文中写道：“通过将模型和代码作为开放源码发布，为开发者提供了一个起点，使他们能够建立和扩展该项目，并促进社区内用户的创新和协作。”

参考资料：

https://baijiahao.baidu.com/s?id=1763153584880974511&wfr=spider&for=pc

https://www.engadget.com/meta-shares-ai-model-that-can-detect-objects-it-hasnt-seen-before-210002471.html

标签：

1、让AI模型读懂绘画

2、用户：期待更全面的AI绘图工具

3、将手绘人物变成动画

4、自己运行开源代码

5、写在最后AI技术开源，激活创造力

参考资料：

Meta发布AI开源大作，将涂鸦变成动画原创精选

张家口怀安：李信屯村工作队为乡村振兴赋能添智

4月25日国内BDO市场行情坚挺上行

观想科技2022年净利降7成 2021年上市一创投行保荐全球聚焦

天天滚动:焦点科技：推出AI外贸助手

中科蓝讯2023年第一季度净利4941.68万同比增长23.05% 下游及终端需求增强

捷邦科技：公司的单壁碳纳米管目前已完成实验室试制阶段全球滚动

海新能科：如大股东有回购计划或管理层有增持计划，公司将按规定披露相关信息天天热推荐

达志科技：公司非常重视新能源电池技术研发储备，在新能源电池技术方面有专门的研发团队|环球快讯

企业营收利润同比增长乐歌股份大涨11%

焦点日报：欧世盛科技获5000万融资

天天速讯：每日晨报

秦昭王秦始皇什么关系看完你就知道了热闻

重大通报：昆明男科医院“排名前三”_昆明男科[正式公布] 环球新资讯

大连海洋大学2023年硕士研究生招生调剂公告

做剪刀腿有什么好处？剪刀腿怎么做？

【全球报资讯】文明村镇丨雨湖区红旗村巩固市级文明村成果纪实

嘉峪关机务段嘉峪关东运用车间多措并举全力保障兰新线运输安全畅通-环球即时看

天天热议:反餐饮浪费！安徽出台两项省级地方标准

【热闻】研究发现：AI聊天机器人让初级员工工作效率提高了35%

全球快看：热点题材 |“AI+”概念是什么？（附十大概念股）

世界信息:港股概念追踪 | “氢能走廊”初见雏形！长距离输氢迎新突破规模化应用获加速(附概念股)

每日热讯!榆阳智慧教育成果在陕西数字教育大会巡展

公共 | 舞蹈赋美助力亚运头条焦点

比特矿业美股跌7.83%

男士鞋子品牌排行榜_男士橙色鞋子配什么颜色裤子-每日看点

歌尔股份2022年增收不增利：声学整机遭大客户砍单机构称未来业绩成长存不确定性_世界视点

天天速讯：算力概念股震荡反弹中科曙光涨近9%

拆迁风险评估之后多久拆迁？|环球实时

速递！A股异动 | 协创数据涨近17% 一季度净利增55%