新鲜事儿！只有AI作品的电影节；酷~AI纹身设计师；ChatGPT的接生婆RLHF；Wayve自动驾驶模型MILE…

新鲜事儿！只有AI作品的电影节；酷~AI纹身设计师；ChatGPT的接生婆RLHF；Wayve自动驾驶模型MILE… | ShowMeAI资讯日报

Source

👀日报合辑 | 🎡AI应用与工具大全 | 🔔公众号资料下载 | 🍩@韩信子

📢 『AI Film Festival』只接受AI作品的电影节，一万美元奖金花落谁家？

https://aiff.runwayml.com/

Runway ML公司12月7日推出首届 AI 电影节，接受内容创作者提交 AI 技术参与生成/编辑的电影，时长在1-10分钟之间。1月中旬截止提交后，电影节评委计划根据构图质量、叙事凝聚力、原创性以及使用的人工智能技术来评估每份提交的作品，并于月底公布10部入围决赛的电影名单。2月21日的颁奖仪式将在纽约 Metrograph 剧院举办，除了放映10部入围电影外，还将公布一万美元的奖金归属。

Runway ML是美国一家 AI 初创公司，提供的产品套件包含数几十种工具，使得图像、音频和视频的生成与编辑更加快捷高效。Runway 联合创始人和CEO Cristóbal Valenzuela 表示，虽然 AIGC 还存在一些争议，但它为非技术人员和创意人员打开了创作的大门，并带领内容创作领域走向新的可能。这届 AI 电影节就是窥视未来的一个窗口。

ShowMeAI 🎡AI应用与工具大全 页面，汇总了100+人工智能工具，包括个人、企业、行业、科研等4大应用场景，智能家居、增强现实AR、运动健康、聊天机器人、广告营销、教育、农业、无人机、自动驾驶、文本生成、图像生成等领域！是AI开发者和数字行业工作者的百宝箱！如有遗漏或推荐，欢迎联络留言！

🎡 『TattoosAI』超酷的 AI 纹身设计师

https://www.tattoosai.com/

TattoosAI 是一个使用 AI 设计纹身图案的应用，输入文本描述并选择分割与颜色，就可以收到 AI 设计的批量纹身图案。这对苦于没有设计灵感的纹身师、对寻找独特图案的纹身者来说，都是非常酷的应用！

TattoosAI 的免费试用功能提供 8 款设计，解锁更多功能则需要付费了。此外，平台按照主题构建了一个图像库，使用者也可以搜索关键词，查看是否有自己喜欢的图案。

🎡 『AI Room Planner』将 AI 用于室内设计

https://airoomplanner.com/

AI Room Planner 将人工智能应用于室内设计的一款应用。上传空间照片后，选择客厅、卧室、厨房、书房、办公室等使用场景，并从候选清单中选择喜欢的装修风格，AI 将生成一批装修后的效果图片，供使用者参考。产品目前处于beta测试阶段，可以免费使用。

🔥 『HuggingFace · RLHF』自人类反馈的强化学习 RLHF 与ChatGPT的诞生

https://huggingface.co/blog/rlhf

过去几年里，输入提示词就能生成多样化文本的语言模型，显示出的能力令人印象深刻。然而我们很难通过损失函数等定义输出文本的质量。什么是“好”文本呢？使用人类对生成文本的反馈作为性能的衡量标准，或者更进一步，将这种反馈作为损失来优化模型，这就是 Reinforcement Learning from Human Feedback（RLHF，来自人类反馈的强化学习）的原理。RLHF 最近的成功应用是 ChatGPT。

RLHF 涉及三个模型的训练和部署，博文对这个过程进行了详细的讲解：

① 预训练语言模型（Pretraining language models）。作为起点，RLHF 选用的预训练语言模型，已经使用经典预训练目标完成了预训练。

② 奖励模型训练（Reward model training）。接下来，生成数据来训练奖励模型，也就是将人类的偏好集成到系统中。

③ 用强化学习进行微调（Fine-tuning with RL）。RLHF 系统有一个初始语言模型（生成文本）和一个偏好模型（接收文本并为其分配人类感知程度的分数）。最后使用强化学习（RL）技术，结合偏好模型的反馈来优化初始语言模型。

自 OpenAI 2019年发布第一个在语言模型上执行 RLHF 的代码以来，PyTorch 已经有一些活跃的项目，主要包括TRL（Transformers Reinforcement Learning）、TRLX、RL4LMs等。不过，虽然这些技术非常有前景，并引起了 AI 领域头部实验室的注意，但仍存在明显的局限性：人类标注者偏差造成输出文本不准确，以及训练过程非常昂贵等。

🔥 『Wayve · MILE』Wayve自动驾驶汽车端到端深度学习模型

https://arxiv.org/pdf/2210.07729.pdf

Wayve 是一家专注于 AI 深度学习技术的自动驾驶公司，近期发布了其最先进的端到端模型 MILE（Model-Based Imitation Learning），用于学习基于 CARLA 模拟数据的世界模型和车辆驾驶策略，允许汽车在没有高清地图环境中自动驾驶。

MILE 强化学习模型由五个主要组成部分，使用 CARLA 模拟器不同天气下的 32 小时的驾驶数据，学习世界模型和驾驶策略。

① Observation encoder（观察编码器）。首先将图像特征提升为3D，然后使用预定义的格网将 3D 要素体素汇总到鸟瞰图（BEV），并进一步将BEV特征压缩为一维向量。

② Probabilistic modeling（概率建模）。世界模型经过训练，将先验分布（对执行操作后会发生什么的猜测）与后验分布（实际发生的证据）进行匹配。

③ Decoders（解码器）。具有与 StyleGAN 类似的架构，以不同的分辨率放大编码器输出、BEV 和潜在状态，并输出车辆控制。

④ Temporal modeling（时间建模）。使用循环网络对时间进行建模，从上一个潜在状态预测下一个潜在状态。

⑤ Imagination（想象）。模型可以想象未来的潜在状态，并使用它们来计划和预测使用驾驶策略的操作。

为了衡量驾驶性能，Wayve 使用了路线完成度违规处罚、驾驶分数三个指标。相较于LAV、Roach、Transfuser等其他框架，MILE 实现了更高的泛化和更好的驾驶分数。这意味着 MILE 能够合理想象未来并成功规划车辆的运行，而无需访问对真实世界的最新观测结果。

🚧 『Powderworld』用于理解 AI 泛化的轻量仿真环境

https://github.com/kvfrans/powderworld

AI 新趋势是研究一个环境中解决多种任务的通用代理。一个理想的“基础环境”应该提供代表现实世界物理的丰富动态，同时保持快速评估和重置，为此我们引入了 Powderworld。

Powderworld 提供了一个 2D 规则集，元素（例如沙子、水、火）以模块化方式做出反应。Powderworld 直接在 GPU 上运行，每秒最多允许 10,000 个模拟步骤，比其他 RL 环境（如 Atari 或 MineRL）快一个数量级。

🚧 『MAgent2』用于高性能多代理环境的引擎

https://github.com/Farama-Foundation/MAgent2

MAgent2 是一个用于创建环境的库，是原始 MAgent 代码库的维护分支，包含一些使用 PettingZoo API 实现的参考环境。在 MAgent2 环境中，网格世界中的大量像素代理在战斗或其他竞争场景中进行交互。

🚧 『Hello,算法』一本动画图解、能运行、可提问的数据结构与算法入门书

https://github.com/krahets/hello-algo

https://www.hello-algo.com/

这是一本面向数据结构与算法初学者的开源书籍，帮助了解刷题所需的数据结构、各类算法以及一套可运行的代码，是非常好的入门读物。对于有一定算法基础的读者，这本篇幅不长的工具书也可以提纲挈领地帮助回顾算法知识。

🚧 『Ulixee Hero』面向爬虫的浏览器

https://github.com/ulixee/hero

Hero 是第一款专为抓取而设计的浏览器，直接在 NodeJS 中重新创建了一个完全兼容的 DOM，可以绕过抓取工具的麻烦。Hero 由 Chrome 提供支持，可实现闪电般的快速渲染，并可以轻松地将脚本伪装成几乎任何浏览器。

🚧 『auto-commit』自动生成 commit messages 的命令行工具

https://github.com/m1guelpf/auto-commit

这是一个基于 Rust 和 OpenAI’s Codex 的 CLI 工具，可以根据暂存更改中自动生成 commit messages。要想使用这个工具，首先访问 Codex 并获取权限，从仪表板获取 API 密钥后，将其保存到OPENAI_API_KEY。配置环境后，通过运行git add等来暂存一些更改，然后运行自动提交。

◉ 点击 👀日报合辑，公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。

◉ 点击 🎡AI应用与工具大全，体验100+前沿AI产品带来的效率飞跃。

◉ 公众号 🔔ShowMeAI研究中心 回复关键字日报，免费获取独家AI发展趋势报告、原创AI专题资料合辑，一览AI技术发展前沿，捕捉有价值的业务应用案例！