新鲜事儿!只有AI作品的电影节;酷~AI纹身设计师;ChatGPT的接生婆RLHF;Wayve自动驾驶模型MILE… | ShowMeAI资讯日报

Source

👀日报合辑 | 🎡AI应用与工具大全 | 🔔公众号资料下载 | 🍩@韩信子

📢 『AI Film Festival』只接受AI作品的电影节,一万美元奖金花落谁家?

https://aiff.runwayml.com/

Runway ML公司12月7日推出首届 AI 电影节,接受内容创作者提交 AI 技术参与生成/编辑的电影,时长在1-10分钟之间。1月中旬截止提交后,电影节评委计划根据构图质量、叙事凝聚力、原创性以及使用的人工智能技术来评估每份提交的作品,并于月底公布10部入围决赛的电影名单。2月21日的颁奖仪式将在纽约 Metrograph 剧院举办,除了放映10部入围电影外,还将公布一万美元的奖金归属。

Runway ML是美国一家 AI 初创公司,提供的产品套件包含数几十种工具,使得图像、音频和视频的生成与编辑更加快捷高效。Runway 联合创始人和CEO Cristóbal Valenzuela 表示,虽然 AIGC 还存在一些争议,但它为非技术人员和创意人员打开了创作的大门,并带领内容创作领域走向新的可能。这届 AI 电影节就是窥视未来的一个窗口。

ShowMeAI 🎡AI应用与工具大全 页面,汇总了100+人工智能工具,包括个人企业行业科研等4大应用场景,智能家居、增强现实AR、运动健康、聊天机器人、广告营销、教育、农业、无人机、自动驾驶、文本生成、图像生成等领域!是AI开发者和数字行业工作者的百宝箱!如有遗漏或推荐,欢迎联络留言!

🎡 『TattoosAI』超酷的 AI 纹身设计师

https://www.tattoosai.com/

TattoosAI 是一个使用 AI 设计纹身图案的应用,输入文本描述并选择分割与颜色,就可以收到 AI 设计的批量纹身图案。这对苦于没有设计灵感的纹身师、对寻找独特图案的纹身者来说,都是非常酷的应用!

TattoosAI 的免费试用功能提供 8 款设计,解锁更多功能则需要付费了。此外,平台按照主题构建了一个图像库,使用者也可以搜索关键词,查看是否有自己喜欢的图案。

🎡 『AI Room Planner』将 AI 用于室内设计

https://airoomplanner.com/

AI Room Planner 将人工智能应用于室内设计的一款应用。上传空间照片后,选择客厅、卧室、厨房、书房、办公室等使用场景,并从候选清单中选择喜欢的装修风格,AI 将生成一批装修后的效果图片,供使用者参考。产品目前处于beta测试阶段,可以免费使用。

🔥 『HuggingFace · RLHF』自人类反馈的强化学习 RLHF 与ChatGPT的诞生

https://huggingface.co/blog/rlhf

过去几年里,输入提示词就能生成多样化文本的语言模型,显示出的能力令人印象深刻。然而我们很难通过损失函数等定义输出文本的质量。什么是“好”文本呢?使用人类对生成文本的反馈作为性能的衡量标准,或者更进一步,将这种反馈作为损失来优化模型,这就是 Reinforcement Learning from Human Feedback(RLHF,来自人类反馈的强化学习)的原理。RLHF 最近的成功应用是 ChatGPT。

RLHF 涉及三个模型的训练和部署,博文对这个过程进行了详细的讲解:

① 预训练语言模型(Pretraining language models)。作为起点,RLHF 选用的预训练语言模型,已经使用经典预训练目标完成了预训练。

② 奖励模型训练(Reward model training)。接下来,生成数据来训练奖励模型,也就是将人类的偏好集成到系统中。

③ 用强化学习进行微调(Fine-tuning with RL)。RLHF 系统有一个初始语言模型(生成文本)和一个偏好模型(接收文本并为其分配人类感知程度的分数)。最后使用强化学习(RL)技术,结合偏好模型的反馈来优化初始语言模型。

自 OpenAI 2019年发布第一个在语言模型上执行 RLHF 的代码以来,PyTorch 已经有一些活跃的项目,主要包括TRL(Transformers Reinforcement Learning)、TRLX、RL4LMs等。不过,虽然这些技术非常有前景,并引起了 AI 领域头部实验室的注意,但仍存在明显的局限性:人类标注者偏差造成输出文本不准确,以及训练过程非常昂贵等。

🔥 『Wayve · MILE』Wayve自动驾驶汽车端到端深度学习模型

https://arxiv.org/pdf/2210.07729.pdf

Wayve 是一家专注于 AI 深度学习技术的自动驾驶公司,近期发布了其最先进的端到端模型 MILE(Model-Based Imitation Learning),用于学习基于 CARLA 模拟数据的世界模型和车辆驾驶策略,允许汽车在没有高清地图环境中自动驾驶。

MILE 强化学习模型由五个主要组成部分,使用 CARLA 模拟器不同天气下的 32 小时的驾驶数据,学习世界模型和驾驶策略。

① Observation encoder(观察编码器)。首先将图像特征提升为3D,然后使用预定义的格网将 3D 要素体素汇总到鸟瞰图 (BEV),并进一步将BEV特征压缩为一维向量。

② Probabilistic modeling(概率建模)。世界模型经过训练,将先验分布(对执行操作后会发生什么的猜测)与后验分布(实际发生的证据)进行匹配。

③ Decoders(解码器)。具有与 StyleGAN 类似的架构,以不同的分辨率放大编码器输出、BEV 和潜在状态,并输出车辆控制。

④ Temporal modeling(时间建模)。使用循环网络对时间进行建模,从上一个潜在状态预测下一个潜在状态。

⑤ Imagination(想象)。模型可以想象未来的潜在状态,并使用它们来计划和预测使用驾驶策略的操作。

为了衡量驾驶性能,Wayve 使用了路线完成度违规处罚、驾驶分数三个指标。相较于LAV、Roach、Transfuser等其他框架,MILE 实现了更高的泛化和更好的驾驶分数。这意味着 MILE 能够合理想象未来并成功规划车辆的运行,而无需访问对真实世界的最新观测结果。

🚧 『Powderworld』用于理解 AI 泛化的轻量仿真环境

https://github.com/kvfrans/powderworld

AI 新趋势是 研究一个环境中解决多种任务的通用代理。一个理想的“基础环境”应该提供代表现实世界物理的丰富动态,同时保持快速评估和重置,为此我们引入了 Powderworld。

Powderworld 提供了一个 2D 规则集,元素(例如沙子、水、火)以模块化方式做出反应。Powderworld 直接在 GPU 上运行,每秒最多允许 10,000 个模拟步骤,比其他 RL 环境(如 Atari 或 MineRL)快一个数量级。

🚧 『MAgent2』用于高性能多代理环境的引擎

https://github.com/Farama-Foundation/MAgent2

MAgent2 是一个用于创建环境的库,是原始 MAgent 代码库的维护分支,包含一些使用 PettingZoo API 实现的参考环境。在 MAgent2 环境中,网格世界中的大量像素代理在战斗或其他竞争场景中进行交互。

🚧 『Hello,算法』一本动画图解、能运行、可提问的数据结构与算法入门书

https://github.com/krahets/hello-algo

https://www.hello-algo.com/

这是一本面向数据结构与算法初学者的开源书籍,帮助了解刷题所需的数据结构、各类算法以及一套可运行的代码,是非常好的入门读物。对于有一定算法基础的读者,这本篇幅不长的工具书也可以提纲挈领地帮助回顾算法知识。

🚧 『Ulixee Hero』面向爬虫的浏览器

https://github.com/ulixee/hero

Hero 是第一款专为抓取而设计的浏览器,直接在 NodeJS 中重新创建了一个完全兼容的 DOM,可以绕过抓取工具的麻烦。Hero 由 Chrome 提供支持,可实现闪电般的快速渲染,并可以轻松地将脚本伪装成几乎任何浏览器。

🚧 『auto-commit』自动生成 commit messages 的命令行工具

https://github.com/m1guelpf/auto-commit

这是一个基于 Rust 和 OpenAI’s Codex 的 CLI 工具,可以根据暂存更改中自动生成 commit messages。要想使用这个工具,首先访问 Codex 并获取权限,从仪表板获取 API 密钥后,将其保存到OPENAI_API_KEY。配置环境后,通过运行git add等来暂存一些更改,然后运行自动提交。

◉ 点击 👀日报合辑,公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。

◉ 点击 🎡AI应用与工具大全,体验100+前沿AI产品带来的效率飞跃。

◉ 公众号 🔔ShowMeAI研究中心 回复关键字 日报,免费获取独家AI发展趋势报告、原创AI专题资料合辑,一览AI技术发展前沿,捕捉有价值的业务应用案例!