论文不记之《Legible Compact Calligrams》

本文介绍了一种紧凑画诗生成算法,它通过由粗到细的方法,输入小写字母和轮廓图,自动生成具有语义的画诗。该算法包括路径生成、字母校准和字母变形三个步骤,并提出了从众包数据中得出的易读性度量。
1、本文主要贡献

本文的主要贡献是首次提出清晰的紧凑画诗生成,另一个是从众包数据中得出的易读性度量。

2、大纲:

该算法通过由粗到细的方法,输入小写字母和轮廓图,自动生成具有语义的画诗。如下图所示:


a.路径生成:在最粗糙的处理层,本文将文本看作一个矩形并希望其以最小的形变适应图像的轮廓。即有足够的空间容纳这些文字,由此生成一条排放文字的路径。

b.字母校准:在这一层,本文需要沿着路径排列文字。从纯易读性和美学的角度讲,每个字母按空间划分成相同大小最合适,但这种朴素的解决办法没法适用于突出较大的地方,比如动物的腿。为了平衡可读性和适应性,本文使用字母的突出特征去适应形状轮廓中的突出点。

c.字母变形考虑到近似的位置,缩放比例和所有字母的朝向,本文方法最精细的一步是将单个字母变形为最符合标准的同时保证它们的易读性。最大的挑战是没法评估变形对于可读性的影响,解决这个问题是本文的贡献之一,本文借鉴了从排版文献中想到的一些特征并使用众包输入学习他们的相对重要性。最后应用这个标准做参考。

3、总结:

本文的最终目的不是为了代替专业的艺术家,而是为他们提供辅助,所以本文的最终结果也是可以与使用者交互的。本文的限制和未来工作大致有以下几点:

a.需要有画诗模板,专业的艺术家会把模板的姿势也考虑进去,所以如果能根据文字更改画诗模板是未来的一个有趣的扩展。

b.可读性的潜在运用,本文提出的可读性模型可能适用于其他应用。

c.联合限制变形,类似本文根据对可读性的研究,可以看到一种联合变形概念的提出。

d.训练数据的限制,用于训练产生多种变形字母的数据只覆盖了一定的变形空间,如果有更多数据,可以使用更先进的工具,例如深度神经网络。

e.技术限制,一个主要的限制是本文假设布局路径是单一的低曲率线,无法自动生成覆盖多低曲率的优雅画诗,需要人工添加辅助线条。如下图所示:


f.未来工作:

         (i)除了提供单词和图片,用户也可以只提供文字性的描述来生成画诗,例如用“a jumping tiger”代替图片。

         (ii)计算可重复使用的字母形状或者分段可以用于输入的图形也是有趣的研究。

         (iii)在愉悦视觉层面,进行两个画诗的形状到形状,字母到字母的变换也是未来有趣的工作之一。


内容概要:本文介绍了基于贝叶斯优化的CNN-LSTM混合神经网络在时间序列预测中的应用,并提供了完整的Matlab代码实现。该模型结合了卷积神经网络(CNN)在特征提取方面的优势与长短期忆网络(LSTM)在处理时序依赖问题上的强大能力,形成一种高效的混合预测架构。通过贝叶斯优化算法自动调参,提升了模型的预测精度与泛化能力,适用于风电、光伏、负荷、交通流等多种复杂非线性系统的预测任务。文中还展示了模型训练流程、参数优化机制及实际预测效果分析,突出其在科研与工程应用中的实用性。; 适合人群:具备一定机器学习基基于贝叶斯优化CNN-LSTM混合神经网络预测(Matlab代码实现)础和Matlab编程经验的高校研究生、科研人员及从事预测建模的工程技术人员,尤其适合关注深度学习与智能优化算法结合应用的研究者。; 使用场景及目标:①解决各类时间序列预测问题,如能源出力预测、电力负荷预测、环境数据预测等;②学习如何将CNN-LSTM模型与贝叶斯优化相结合,提升模型性能;③掌握Matlab环境下深度学习模型搭建与超参数自动优化的技术路线。; 阅读建议:建议读者结合提供的Matlab代码进行实践操作,重点关注贝叶斯优化模块与混合神经网络结构的设计逻辑,通过调整数据集和参数加深对模型工作机制的理解,同时可将其框架迁移至其他预测场景中验证效果。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值