《泰坦尼克号》漫画版?中国高校学者开发全自动漫画生成系统
《泰坦尼克号》漫画版?中国高校学者开发全自动漫画生成系统
学术头条
· 刚刚
来自大连理工大学和香港城市大学的研究人员在自动创作领域又做出了新成果,该团队联合创建出了一个可以自动生成漫画书的新型系统,该系统通过从电视剧、电影、动画或其他视频中提取数据,从而创作漫画书。
《泰坦尼克号》漫画版?中国高校学者开发全自动漫画生成系统
图片来源@视觉中国
文 | 学术头条
近年来,随着计算机科学得到飞速发展,科学家们不断取得新的技术突破,尤其是随着机器学习的迅猛发展,各种各样的计算模型被创造出来,比如可以自动生成文本、图像和其他类型数据的计算模型。这些模型相较于传统计算模型,在创建对人类手工制作要求高、耗时长的数据或创意作品时,表现出了很大的优势。
例如,在人工智能领域不断涌现出一批具有超凡本领的创作机器人,有自动创作水墨画的 “艺术家”,自动写作诗歌的 “文学作家”,自动生成高考作文的 “高考小能手”,经过大量的经验训练,这些计算模型甚至拥有了过人的创作力。
而今,来自大连理工大学和香港城市大学的研究人员在自动创作领域又做出了新成果,该团队联合创建出了一个可以自动生成漫画书的新型系统,该系统通过从电视剧、电影、动画或其他视频中提取数据,从而创作漫画书。
来源:arXiv
相关研究以 “Automatic Comic Generation with Stylistic Multi-page Layouts and Emotion-driven Text Balloon Generation” 为题,发表在 arXiv 预印本平台上。
研究人员在论文中写道:“我们提出一个全自动系统,从任意类型的视频(电视连续剧、电影、卡通剧)生成漫画书。我们的系统不需要用户的任何手动输入,可以生成高质量的漫画页面,具有丰富的视觉效果和富有表现力的故事。”
全自动漫画生成系统
漫画是一种艺术形式,一种用简单而夸张的手法来描绘生活或时事的图画。漫画的创作过程往往需要经历选题、搜集素材、绘制分镜草稿和编辑调整沟通等一系列过程,漫画书的创作不仅需要精湛的专业技术,更需要丰富的内容素材和大量的创作精力,通常非专业人士很难制作出自己的漫画书。
在互联网如此发展迅速的当今,网上每天有成千上万的短视频发布出来,结合漫画便捷的阅读形式和出色的故事描述技术,人们不禁会想象是否可以将这些视频自动转换为具有丰富的视觉效果和出色的叙事能力的高质量漫画书?
近年来,由视频生成漫画的相关技术取得了一定的进展,但所创建的模型大多不是全自动的,生成的漫画作品要么需要额外的用户输入,要么使用简化的表示形式或方法进行漫画页布局,从而导致整个漫画效果缺乏视觉多样性和表现力。
该最新研究解决了通过算法在页面之间分配所选关键帧,然后在每个页面漫画风格的布局上组织关键帧的问题。研究人员采用一种数据驱动的布局方法,从漫画数据中学习布局样式,通过自动从关键帧中提取系统的输入来扩展他们的方法,因此无需任何形式的用户输入,即可实现布局框架的完全自动化。
图 | 该系统的整体设计流程。(a)关键帧提取和风格化;(b)自动多页布局框架(红色、紫色和绿色虚线框表示不同的组);(c)对话气球的生成和放置。(来源:论文)
研究人员还设计了一种数据驱动的情绪感知气球生成模型,该模型可以生成不同的气球形状,并根据字幕和音频的情感动态调整字体大小。然后,通过检测谁在讲话以及讲话者嘴巴的位置,将生成的气球放置在正确的位置。
该研究所创建的框架并不像大多数漫画生成框架那样,总是使用同一种类型的语音气球,而是生成不同类型的气球,以反映人物话语所传达的情感。为了做到这一点,对于给定一个输入视频片段,研究人员首先尝试通过分析视频获得对应的音频和相应的字幕,然后对字幕和音频进行情感分析,来把握不同的对话台词所传达的情感。
之后,模型根据人物所传达的情感,创造出形状和文字大小各异的对话气球。这极大地改善了整体漫画阅读体验,产生了更吸引人的布局,也反映了不同角色之间的对话内容。
图 | 不同情感的对话气球生成过程(Emotion-aware Balloon Generation)(来源:论文)
为了实现系统生成的语音气球可以被放置在正在说话的角色附近,该模型首先检测视频中不同的说话者,然后在他们的附近放置与他们所表达的情绪一致的语音气球。
图 | 对话者检测流程(来源:论文)
为了允许用户对生成的结果进行某种程度的控制,研究人员构建了一个用户友好的界面,来向用户施加约束,以构建更多个性化的设计,并优化结果。研究表明,该用户界面可以节省用户时间,同时提供更多的创建自由。
在从视频中提取关键帧并将其转化为漫画风格的图像后,研究人员设计的系统使用多页布局框架将图像分布在多个页面上,并创建出具有视觉吸引力的布局,以反映图像之间的关系。
研究人员表示:“该系统在无需任何人工干预的前提下,给定一个输入视频及其字幕,首先通过分析字幕提取信息关键帧,然后将关键帧图像转化为漫画风格的图像。”
用户体验怎么样?
研究人员通过一系列实验,评估了他们所设计的系统及各个模块,并选择四部电影(Titanic、《风声》、Friends 和 Up in the Air)和系列片中提取的 16 个长短为 2 至 6 分钟不等的视频片段,使用该系统与当前最先进的漫画生成系统 “Content-Aware Video2Comics” 分别生成漫画,并就漫画质量进行对比分析。
图 | 该系统与一个名为 “Content-Aware Video2Comics” 的系统在漫画生成效果上的比较。(a)图-(d)图是该研究的生成效果;(e)图-(h)图为 “Content-Aware Video2Comics” 系统的生成效果。(来源:论文)
对比发现,该系统的漫画生成效果要优于其他系统,不仅能够生成更丰富的气球形状,还可以利用文本摘要来合并一些相关的字幕,以确保单词气球句子长度适中,关键是可以实现全自动多页布局,其布局效果合理、丰富。
该研究团队还招募了 40 位用户,让他们观看视频后阅读系统生成的漫画,并围绕漫画的整体效果、对话气球质量、布局质量、故事讲述效果、阅读体验等指标,对系统所生成的漫画与另一种漫画生成系统所制作的漫画进行了对比评价。绝大多数参与这项研究的用户表示,与之前开发的系统相比,他们更喜欢研究人员的模型所制作的版面。
图 | 用户评估结果图,纵轴表示每个问题的平均评分,横轴表示视频编号(图中蓝色条形柱表示 “Content-Aware Video2Comics” 系统的评分,橙色表示该系统的评分)(来源:论文)
研究人员表示:“我们的实验表明,与最先进的漫画生成系统相比,我们的系统可以合成更具表现力和吸引力的漫画。”
不过,虽然该系统已经被证明取得了可喜的结果,但它仍存在一定的局限。例如,关键帧的选择不够准确,在某些情况下,所选择的关键帧彼此相似,无疑会给生成的漫画带来冗余信息。
研究人员表示,一旦系统后续被更加完善,该漫画生成系统即可用来自动创建基于电影、电视剧或其他视频内容的漫画书。在后续的研究中,研究人员还计划开发一种可替代的关键帧选择模块,以此来提高系统生成的漫画布局质量,减少关键帧的冗余。
“更重要的是,受到许多现有方法的启发,这些方法可以根据所给定的含有多个句子的故事来生成图像序列,有可能从文本故事中产生漫画书,我们有兴趣将我们的方法扩展到利用文本信息来帮助生成漫画。” 研究人员在论文中总结道。
234篇资讯
20.2k关注
学术头条
见证探索之途上的每一步重大突破
最近资讯
- 《泰坦尼克号》漫画版?中国高校学者开发全自动漫画生成系统
- 可与“狗鼻子”媲美的AI癌症检测系统问世,或装在你的手机中
- 科学家在人类肠道中鉴定出14万种病毒,其中一半以上从未见过
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里。
敬原创,有钛度,得赞赏
-
钛粉35141 赞赏了
马云和他的三个“赌王”朋友
昨天 -
钛粉12618 赞赏了
中国认知智能行业报告
约4天以前 -
钛粉20295 赞赏了
北大教授彭波发表英文论文,深剖国家治理的“数字领导...
2021-02-09 14:15 -
钛粉05059 赞赏了
陆奇万字演讲:中国经济形态与东南亚相似,创业创新易...
2021-02-09 11:08 -
钛粉69389 赞赏了
视频号是微信小游戏弯道超车的大好机会
2021-02-07 13:58 -
钛粉67426 赞赏了
我在抖音生产主播,投入一个亿,只挣两百万
2021-02-07 03:18 -
钛粉45533 赞赏了
在虚拟影院边看电影边社交是种怎样的体验?
2021-02-04 12:44 -
钛粉80055 赞赏了
能睡眠遮噪还能听音乐,1MORE ComfoBud...
2021-01-30 02:56 -
钛aB1IyM 赞赏了
“俗”人李子柒
2021-01-27 22:21 -
钛粉65171 赞赏了
敬“墨茶”一篮草莓,希望他在远方没有病痛和穷苦
2021-01-24 10:14 -
钛粉38610 赞赏了
网络平台涉黄屡禁不止,网络环境何时迎来健康未来?
2021-01-22 08:44 -
钛粉91023 赞赏了
巨头下注,播客虚火
2021-01-19 13:26 -
钛粉25879 赞赏了
中国下一个 “巨无霸”交易平台是什么?
2021-01-18 16:09 -
钛粉50426 赞赏了
谁会是中国小电厨电第一个千亿之王?
2021-01-13 16:45 -
钛a2I9ui 赞赏了
特斯拉降价,苦了自主新能源车
2021-01-11 23:04 -
蒙MYH 赞赏了
“喝”出万亿大市场:0糖更快乐,植物基出圈
2021-01-11 14:39 -
hU8dfb 赞赏了
中国电商的下一个绝佳机会
2021-01-05 15:37 -
钛粉76789 赞赏了
一个“傻瓜式”的SaaS开店工具,如何赚得千亿美金...
2021-01-04 14:16 -
钛粉68961 赞赏了
挑战海拉尔零下30度,体验一汽丰田双擎混动技术 |...
2021-01-03 16:31 -
钛粉18683 赞赏了
2020年最后一天,社交平台Uki被Soul前员工...
2020-12-31 10:30 -
钛粉17696 赞赏了
2020年最后一天,社交平台Uki被Soul前员工...
2020-12-31 10:23 -
h2WkpG 赞赏了
2020年最后一天,社交平台Uki被Soul前员工...
2020-12-31 10:17 -
hwDjnH 赞赏了
2020年最后一天,社交平台Uki被Soul前员工...
2020-12-31 10:10 -
钛粉40181 赞赏了
石家庄,工厂子弟,和“万青”失去的十年
2020-12-25 14:33 -
钛粉89488 赞赏了
中高端MPV竞争,微妙平衡中寻找取胜之道
2020-12-18 16:41 -
钛粉89860 赞赏了
中高端MPV竞争,微妙平衡中寻找取胜之道
2020-12-18 16:32 -
钛粉15908 赞赏了
英特尔:硅谷文化的最后传承者 | 钛媒体深度
2020-12-15 13:47 -
钛粉77486 赞赏了
苹果:拨弄中、美、日命运的人
2020-12-07 08:11 -
钛粉02929 赞赏了
为何上海高院未按反垄断法第14条判决?
2020-11-25 15:39 -
Kris00135 赞赏了
“优爱腾”难题无解,长视频去向何方?
2020-11-24 12:04 -
钛粉88011 赞赏了
从荷兰回到张家口种树莓,他想用AI无人种植改变中国...
2020-11-19 17:52 -
钛粉39442 赞赏了
看完美国大选,是时候聊聊国内综艺的投票机制了
2020-11-09 12:59 -
在天空中自由翱翔的百灵鸟 赞赏了
透露一个共享办公的惊人事实:空置率70%-90%
2020-11-06 13:48 -
在天空中自由翱翔的百灵鸟 赞赏了
雷军:继续死磕硬核技术,小米2021年扩招5000...
2020-11-05 18:13 -
钛粉94592 赞赏了
手机用户“被5G”?三大运营商回应:办理4G业务建...
2020-11-04 21:12 -
在天空中自由翱翔的百灵鸟 赞赏了
详解互联网+医保新政:什么病能用?什么钱能报?
2020-11-04 16:51 -
钛粉18709 赞赏了
陈天桥再捐5亿支持中国脑科学研究,先在上海打造这个...
2020-10-23 20:30 -
钛aw26M5 赞赏了
深藏大山的汞矿遗址,孤身守矿的他,一辈子没有离开|...
2020-10-16 08:59 -
钛粉94035 赞赏了
海底捞涉嫌抄袭巴奴,4万亿餐饮行业什么才是核心竞争...
2020-10-10 01:25 -
钛粉15375 赞赏了
中国游戏的光荣与破灭
2020-10-06 13:44 -
钛哥儿 赞赏了
赵何娟对话薇娅:两个女人的知世故而不世故
2020-09-25 13:07 -
钛粉85193 赞赏了
以应用带产品,“自适应”工业级机器人Flexiv试...
2020-09-23 11:43 -
那只猫已转身不见 赞赏了
低房价、高收入,这些城市买房性价比最高
2020-09-18 16:36 -
一潭浑水 赞赏了
豆瓣评分4.8的《花木兰》,真的那么烂吗?
2020-09-12 13:24 -
钛粉59301 赞赏了
市值超四千亿,创造首富,农夫山泉为何这么“甜”?
2020-09-08 17:57 -
钛粉14259 赞赏了
到95后的茶杯里兴风作浪
2020-09-08 12:30 -
钛粉55117 赞赏了
中国APP出海“变形记”:再见工具,你好社交
2020-09-06 23:36 -
钛粉96933 赞赏了
银行与实体经济如何产融对接?产业要全面深入,数据需...
2020-09-05 09:42 -
钛粉86548 赞赏了
代餐赛道会跑出下一个“三只松鼠”吗?| 钛媒体深度
2020-09-01 16:39 -
钛粉22511 赞赏了
【书评】光环效应,另一种乌合之众
2020-08-21 09:43 - 查看精彩文章,打开钛媒体客户端
挺钛度,加点码!
- ¥ 5
- ¥ 10
- ¥ 20
- ¥ 50
- ¥ 100
支付方式
支付
支付金额:¥6
赞赏金额:¥ 6
赞赏时间:2020.02.11 17:32
账户【未登录】提示!
个人中心将无法记录并同步您的赞赏记录,
是否进行登录
分享文章
猜你喜欢
Oh! no
您是否确认要删除该条评论吗?
分享文章