# 艺术 · 文章索引

> AI Art — 视觉艺术、音乐生成、文学创作、版权与原创

## 分类框架

| 子方向 | 关键词 |
|--------|--------|
| 🎨 视觉艺术 | AI 绘画、图像生成、风格迁移 |
| 🎵 音乐生成 | AI 作曲、声音合成、音乐交互 |
| 📝 文学创作 | AI 写作、叙事生成、诗歌生成 |
| ⚖️ 版权与原创 | AI 版权、署名权、创作伦理 |

## 文章列表

## 已收录文章

### 2026

---

#### 📄 1. MuSS: 首个大规模多镜头视频生成数据集与电影叙事基准

| 字段 | 内容 |
|------|------|
| **标题** | 打破垄断！华南理工等团队发布首个大规模多镜头视频生成数据集，推动视频生成迈向工业级应用 |
| **来源** | 机智流 (微信公众号) |
| **日期** | 2026-05-09 |
| **论文** | [arXiv:2604.23789](https://arxiv.org/pdf/2604.23789) |
| **代码** | [github.com/zhang-haojie/MuSS](https://github.com/zhang-haojie/MuSS) |
| **模块** | 🎨 视觉艺术 → AI 视频生成 / 电影叙事 |
| **推荐理由** | 华南理工、复旦、云师大联合提出的大规模多镜头视频生成数据集 MuSS，专治 AI "复制粘贴"顽疾，推动视频叙事迈向电影级连贯与真实。解决了多镜头视频生成中缺乏真实叙事逻辑、时空文本对齐冲突、"复制-粘贴"困境等核心挑战。 |

**原文摘要：** 研究团队提出 MuSS 数据集及配套的电影叙事基准测试，旨在为多镜头视频生成，特别是主体到视频生成，提供大规模、高质量的数据基础设施和科学的评估体系。这标志着 AI 视频生成从"单镜头片段"向"多镜头电影叙事"迈出的关键一步。

**相关链接：**
- [微信公众号原文](https://mp.weixin.qq.com/s/uej0r63cTiy3JQuhHPDrGg)
- arXiv: [https://arxiv.org/pdf/2604.23789](https://arxiv.org/pdf/2604.23789)
- GitHub: [https://github.com/zhang-haojie/MuSS](https://github.com/zhang-haojie/MuSS)

---

#### 📄 2. 阿里巴巴 Pixelle-Video：AI 视频进入"逐帧美学"时代

| 字段 | 内容 |
|------|------|
| **标题** | 视频创作进入"逐帧美学"时代！阿里巴巴 Pixelle-Video 惊艳亮相，让 AI 视频告别"一眼假"！ |
| **来源** | 青瓜王子 (微信公众号) |
| **日期** | 2026-05-03 |
| **代码** | [github.com/aidc-ai/pixelle-video](https://github.com/aidc-ai/pixelle-video) |
| **模块** | 🎨 视觉艺术 → AI 视频生成 / 图像引导视频 |
| **推荐理由** | 阿里巴巴 AIDC-AI 实验室开源的 Pixelle-Video，基于 SVD 架构深度定制，通过动态自适应注意力机制和图像引导逻辑，解决了 AI 视频生成中细节丢失、运动伪影、可控性差三大痛点。推理效率相比同类模型优化约 25%。 |

**原文摘要：** 阿里 AIDC-AI 实验室开源的图像引导视频生成项目 Pixelle-Video，改变了 AI "看"世界的方式。它不再单纯依赖文字描述，而是将图像的高级语义与视频的时空连贯性深度融合，实现"极致的图像保真度"。当输入一张高精度照片时，生成的视频中细节（如旗袍盘扣、刺绣）在动态中依然清晰可见。同时支持对"电影感光效"、"慢动作捕捉"等高级提示词的精准响应。

**完整文章：** [articles/art/pixelle-video.md](art/pixelle-video.md)

**相关链接：**
- [微信公众号原文](https://mp.weixin.qq.com/s/9lKGdCfRsAYfNn6xKrb3Ww)
- GitHub (pixelle-video): [https://github.com/aidc-ai/pixelle-video](https://github.com/aidc-ai/pixelle-video)
- GitHub (ComfyUI Copilot): [https://github.com/AIDC-AI/ComfyUI-Copilot](https://github.com/AIDC-AI/ComfyUI-Copilot)

---

---

#### 📄 3. OpenAI Sora 2：音画同步的视频生成新纪元

| 字段 | 内容 |
|------|------|
| **标题** | OpenAI 深夜炸场：家族最强视频生成模型 Sora 2 发布，还能同步生成音频 |
| **来源** | IT之家 / OpenAI |
| **日期** | 2025-10-01 |
| **论文/产品** | [Sora 2 官方页](https://openai.com/index/sora-2/) |
| **模块** | 🎨 视觉艺术 → AI 视频生成 / 影视创作 |
| **推荐理由** | OpenAI 发布 Sora 2，首次新增同步音频生成能力，视频物理效果大幅提升，并推出 iOS 应用。标志着 AI 视频从"默片"进入"有声电影"时代。 |

**原文摘要：** OpenAI 发布下一代视频生成模型 Sora 2，相比初代在物理规律模拟、音频同步和可控性方面取得断层式进步。Sora 2 能同步生成语音，所有视频带有水印和元数据标识。OpenAI 将 Sora 2 描述为通往更强大 AI 系统和通用世界模拟器的重要一步。

**完整文章：** [articles/art/sora-2-release.md](art/sora-2-release.md)

**相关链接：**
- [IT之家报道](https://www.ithome.com/0/887/039.htm)
- [搜狐报道](https://www.sohu.com/a/941420709_121124773)

---

#### 📄 4. Runway Gen-4：一致性突破的AI视频生成模型

| 字段 | 内容 |
|------|------|
| **标题** | Runway Gen-4: AI Video Generation with World Consistency |
| **来源** | Runway / TechCrunch |
| **日期** | 2025-03-31 |
| **论文/产品** | [Runway Gen-4 官方](https://runwayml.com/research/introducing-runway-gen-4) |
| **模块** | 🎨 视觉艺术 → AI 视频生成 / 电影叙事 |
| **推荐理由** | Runway 发布 Gen-4，主打"世界一致性"和"角色一致性"，解决AI视频长期存在的跨镜头角色不稳定问题。多家好莱坞制片厂已开始试用，被视为AI视频从单镜头向多镜头叙事的跨越。 |

**原文摘要：** Gen-4 支持角色在不同场景、不同镜头中保持外貌、服装统一，场景物体和环境在镜头间保持一致。改进的物理模拟使动作交互更自然。Runway 已与多家好莱坞制片厂合作，应用于前期制作和概念可视化。

**完整文章：** [articles/art/runway-gen4.md](art/runway-gen4.md)

**相关链接：**
- [Runway 官方](https://runwayml.com/research/introducing-runway-gen-4)
- [TechCrunch](https://techcrunch.com/2025/03/31/runway-releases-an-impressive-new-video-generating-ai-model/)

---

#### 📄 5. Google Veo 3：谷歌最强AI视频生成模型

| 字段 | 内容 |
|------|------|
| **标题** | Veo 3：拥有逼真音效的 AI 视频生成，Google 最先进的视频生成技术 |
| **来源** | Google DeepMind |
| **日期** | 2025年5月 (Google I/O) |
| **论文/产品** | [Google Veo 官方页](https://deepmind.google/models/veo/) |
| **模块** | 🎨 视觉艺术 → AI 视频生成 / 影视创作 |
| **推荐理由** | Google DeepMind 发布 Veo 3，首次实现视频与音频同步生成，支持 4K 分辨率输出。全新时空联合注意力架构大幅提升了动作流畅度和物理真实感，被业界视为 AI 影视化的里程碑产品。 |

**原文摘要：** Veo 3 实现了从视频内容到音频的同步生成——对话、音效、环境声一体合成。支持 4K 输出和可配置画面比例。后续推出 Veo 3.1，支持横屏/竖屏输出，成为 AI Studio 平台的核心模型。

**完整文章：** [articles/art/veo3-google.md](art/veo3-google.md)

**相关链接：**
- [Google DeepMind Veo](https://deepmind.google/models/veo/)
- [Google AI Studio - Veo 3](https://aistudio.google.com/models/veo-3)

---

#### 📄 6. Kling 3.0（可灵）：快手全模态AI视频引擎

| 字段 | 内容 |
|------|------|
| **标题** | 可灵3.0 Kling AI - 智能分镜、音画同步、15秒超长视频生成 |
| **来源** | 快手 / 可灵官方 |
| **日期** | 2026 |
| **论文/产品** | [Kling 3.0 官方](https://kling3.io/zh/features) |
| **模块** | 🎨 视觉艺术 → AI 视频生成 / 影视创作 |
| **推荐理由** | 快手可灵3.0 由 Omni One 统一架构驱动，支持物理精确生成、原生音频同步、4K 输出和导演级运镜控制。在第三方评测中多项指标位居前列，是国产 AI 视频模型的代表。 |

**原文摘要：** Kling 3.0 号称"全球首个统一多模态 AI 视频引擎"，支持文生视频、图生视频、音频生成的多模态融合。内置智能分镜系统，支持15秒超长视频和角色定向驱动。

**完整文章：** [articles/art/kling3.md](art/kling3.md)

**相关链接：**
- [Kling 3.0 官方](https://kling3.io/zh/features)
- [可灵 3.0 全模态引擎](https://app.klingai.aigc.cn/)

---

#### 📄 7. 阿里 Pixelle-Video：开源AI全自动短视频引擎

| 字段 | 内容 |
|------|------|
| **标题** | 阿里开源 AI 全自动短视频引擎 · 一句话生成完整视频 |
| **来源** | 阿里巴巴 AIDC-AI / GitHub |
| **日期** | 2025年11月 |
| **论文/产品** | [GitHub - Pixelle-Video](https://github.com/AIDC-AI/Pixelle-Video) |
| **模块** | 🎨 视觉艺术 → AI 视频生成 / 自动化创作 |
| **推荐理由** | 阿里 AIDC-AI 开源的全自动短视频引擎，基于 ComfyUI 架构，从主题输入到成片（文案→配图→配音→配乐→合成）全自动完成。上线半年获近 9000 Star，Apache 2.0 开源。 |

**原文摘要：** Pixelle-Video 只需输入一个主题，即可自动完成文案撰写、AI配图/视频生成、语音解说合成、背景音乐添加和视频合成的全流程。采用模块化设计，支持电影感提示词。

**完整文章：** [articles/art/pixelle-video-2.md](art/pixelle-video-2.md)

**相关链接：**
- [GitHub 仓库](https://github.com/AIDC-AI/Pixelle-Video)
- [知乎深度解析](https://zhuanlan.zhihu.com/p/2036456913035057115)

---

#### 📄 8. 腾讯混元 HunyuanVideo：开源轻量级视频生成模型

| 字段 | 内容 |
|------|------|
| **标题** | 腾讯混元发布并开源 HunyuanVideo 1.5，元宝上线生视频能力 |
| **来源** | 腾讯混元大模型 |
| **日期** | 2025-11-21 |
| **论文/产品** | [HunyuanVideo 官网](https://hunyuan.tencent.com/video/zh) / [GitHub](https://github.com/Tencent-Hunyuan/HunyuanVideo) |
| **模块** | 🎨 视觉艺术 → AI 视频生成 / 开源生态 |
| **推荐理由** | 腾讯混元开源 HunyuanVideo 1.5，仅 8.3B 参数即可在消费级显卡上运行，实现顶尖视频生成质量。团队 CVPR 2026 入选 25 篇论文，是目前最优秀的开源视频生成模型之一。 |

**原文摘要：** 基于 DiT 架构的轻量级视频生成模型，采用 Full Attention 机制统一图像和视频生成。支持 5-10 秒视频生成，"双流到单流"混合设计提升跨模态理解能力。

**完整文章：** [articles/art/hunyuan-video.md](art/hunyuan-video.md)

**相关链接：**
- [腾讯混元视频官网](https://hunyuan.tencent.com/video/zh)
- [GitHub 开源](https://github.com/Tencent-Hunyuan/HunyuanVideo)

---

---

#### 📄 9. PAE：Prior-Aligned Autoencoders — 重塑"扩散友好"潜空间

| 字段 | 内容 |
|------|------|
| **标题** | 重建好≠生成好？PAE重塑Latent Manifold，揭秘"扩散友好"潜空间 |
| **来源** | 机智流 (微信公众号) |
| **日期** | 2026-05 |
| **论文** | [HuggingFace Papers](https://huggingface.co/papers/2605.07915) |
| **代码** | [github.com/ZhengrongYue/PAE](https://github.com/ZhengrongYue/PAE) |
| **模块** | 🎨 视觉艺术 → AI 生成 / 潜空间优化 |
| **推荐理由** | 上海交大与阿里联合研究，从流形几何视角首次定义"扩散友好"潜空间，通过视觉基础模型先验对齐，显式塑造潜空间结构。在 ImageNet 256×256 上以 LightningDiT-XL/1 达 gFID 1.03 新 SOTA，训练效率提升 13 倍，少步采样 45 步达巅峰性能。挑战了"重建质量=生成质量"的传统认知。 |

**原文摘要：** 传统 VAE 以像素级重建 fidelity 为核心目标，但高重建质量不等同于高生成效率。PAE 从潜空间流形几何视角出发，引入三大正则化（SSR、MCR、SCR）显式塑造空间结构、流形连续性和语义组织性，使扩散模型在极少数训练步数下达到最优生成效果。

**完整文章：** [articles/art/pae-prior-aligned-autoencoders.md](art/pae-prior-aligned-autoencoders.md)

**相关链接：**
- [微信公众号原文](https://mp.weixin.qq.com/s/BWwoFbnyPcnqr22u7qK0_g)
- [论文主页](https://zhengrongyue.github.io/pae.github.io/)
- [GitHub 仓库](https://github.com/ZhengrongYue/PAE)

---

#### 📄 10. 文字到视听：AI视频生成的认知逻辑架构

| 字段 | 内容 |
|------|------|
| **标题** | 文字到视听：AI视频生成的认知逻辑架构 |
| **来源** | 原创分析 |
| **日期** | 2026-05-17 |
| **模块** | 🎨 视觉艺术 → AI视频生成 / 理论基础 |
| **推荐理由** | 深入拆解"文字→视频"转换的底层逻辑，从多模态语义对齐（CLIP）、交叉注意力机制、三段式映射框架（语义锚定→时空实例化→感知渲染）到语言符号与视听感知的认知鸿沟，系统性地回答了"AI如何将文字转化为视听体验"这一核心问题。 |

**完整文章：** [articles/art/text-to-audiovisual-logic.md](art/text-to-audiovisual-logic.md)

**原文摘要：** 本文从底层架构视角出发，梳理了AI视频生成从文字到视听的完整逻辑链条：CLIP建立跨模态共享语义空间，交叉注意力机制让文字"导航"像素生成，三层映射框架将稀疏文字符号逐步展开为稠密视听内容。文章还探讨了离散语言符号与连续感知信号之间的认知鸿沟，以及这一根本矛盾如何驱动着视频生成技术的每一次突破。

---

---

#### 📄 11. StyleTextGen: 风格条件的多语言场景文字生成 (CVPR 2026)

| 字段 | 内容 |
|------|------|
| **标题** | StyleTextGen: Style-Conditioned Multilingual Scene Text Generation |
| **作者** | Zeyu Chen, Fangmin Zhao, Yan Shu, Yichao Liu, Liu Yu, Yu Zhou |
| **来源** | **CVPR 2026** (顶级计算机视觉会议) |
| **日期** | 2026-05-14 |
| **论文** | [arXiv:2605.14708](https://arxiv.org/abs/2605.14708) |
| **模块** | 🎨 视觉艺术 → 风格迁移 / 字体艺术 |
| **推荐理由** | CVPR 2026 接收论文。首次系统性地解决多语言场景下的风格化文字生成问题。提出双分支风格编码器、文字风格一致性损失和掩码引导推理策略三大创新，在多语言风格条件文字生成中确立新 SOTA。对 AI 辅助字体设计和品牌视觉系统的跨语言风格统一有重要价值。 |

**原文摘要：** StyleTextGen 框架学习感知和复制不同语言和书写系统中的视觉文字风格。双分支风格编码器专门用于风格建模，文字风格一致性损失增强风格连贯性，掩码引导推理策略确保精确风格对齐。团队还构建了 StyleText-CE 双语场景文字风格基准测试集。

**完整文章：** [articles/art/styletextgen-cvpr2026.md](art/styletextgen-cvpr2026.md)

**相关链接：**
- arXiv: [https://arxiv.org/abs/2605.14708](https://arxiv.org/abs/2605.14708)

---

#### 📄 12. R-DMesh: 视频引导的3D动画 — 修正动态网格流 (SIGGRAPH 2026)

| 字段 | 内容 |
|------|------|
| **标题** | R-DMesh: Video-Guided 3D Animation via Rectified Dynamic Mesh Flow |
| **作者** | Zijie Wu, Lixin Xu, Puhua Jiang, Sicong Liu, Chunchao Guo, Xiang Bai |
| **来源** | **SIGGRAPH 2026** (顶级计算机图形学会议) |
| **日期** | 2026-05-13 |
| **论文** | [arXiv:2605.13838](https://arxiv.org/abs/2605.13838) |
| **模块** | 🎨 视觉艺术 → 3D 内容创作 / 动画生成 |
| **推荐理由** | SIGGRAPH 2026 接收论文。首次解决视频引导 3D 动画中的姿态不对齐问题。提出 R-DMesh 框架，通过 VAE 解耦架构 + Triflow Attention + 修正流扩散 Transformer 生成高保真 4D 网格。构建了 50 万+动态网格序列的 Video-RDMesh 数据集。极大简化从静态模型到动态动画的制作流程。 |

**原文摘要：** 提出修正动态网格 R-DMesh 统一框架，通过新型 VAE 将输入解耦为基础网格、运动轨迹和修正跳跃偏移量，利用 Triflow Attention 保持物理一致性和局部刚性，基于修正流扩散 Transformer 将 2D 视频时空先验迁移到 3D 域。

**完整文章：** [articles/art/rdmesh-siggraph2026.md](art/rdmesh-siggraph2026.md)

**相关链接：**
- arXiv: [https://arxiv.org/abs/2605.13838](https://arxiv.org/abs/2605.13838)

---

#### 📄 13. AI 在个性化图像美学评估中超越人类

| 字段 | 内容 |
|------|------|
| **标题** | AI Outperforms Humans in Personalized Image Aesthetics Assessment via LLM-Based Interviews and Semantic Feature Extraction |
| **作者** | Yoshia Abe, Tatsuya Daikoku, Yasuo Kuniyoshi |
| **来源** | arXiv (cs.AI) |
| **日期** | 2026-05-14 |
| **论文** | [arXiv:2605.14761](https://arxiv.org/abs/2605.14761) |
| **模块** | 🎨 视觉艺术 → 审美评估 / AI 创造力 |
| **推荐理由** | 颠覆性结论：首次通过实验证明 AI 在预测个人审美偏好上可以超越人类自身。LLM 半结构化访谈 + 深度学习特征提取的集成系统预测误差小于个体内变异性。引发「AI 能否作为比人类自身更深层的人类审美感受力解译者」的重要哲学问题。 |

**原文摘要：** 开发深度学习-LLM 集成系统，通过 LLM 半结构化访谈主动获取审美偏好，利用低层和高层特征预测审美评价。系统优于所有对比方法，预测误差小于个体内变异，表明 AI 比他人甚至个体未来的自我更能捕捉个人审美偏好。

**完整文章：** [articles/art/ai-aesthetics-better-than-humans.md](art/ai-aesthetics-better-than-humans.md)

**相关链接：**
- arXiv: [https://arxiv.org/abs/2605.14761](https://arxiv.org/abs/2605.14761)

---

#### 📄 14. InsightTok: 提升自回归图像生成中文字和人脸的保真度

| 字段 | 内容 |
|------|------|
| **标题** | InsightTok: Improving Text and Face Fidelity in Discrete Tokenization for Autoregressive Image Generation |
| **作者** | Yang Yue, Fangyun Wei, Tianyu He, Jinjing Zhao, Zanlin Ni, Zeyu Liu, Jiayi Guo, Lei Shi, Yue Dong, Li Chen, Ji Li, Gao Huang, Dong Chen |
| **来源** | arXiv (cs.CV) |
| **日期** | 2026-05-14 |
| **论文** | [arXiv:2605.14333](https://arxiv.org/abs/2605.14333) |
| **模块** | 🎨 视觉艺术 → 图像生成 / AI 绘画底层架构 |
| **推荐理由** | 揭示了离散分词器目标与文字可读性/面部保真度之间的对齐差距，提出内容感知局部损失解决方案。仅用 16k 紧凑码本+16 倍降采样率，即在文字和人脸重建上显著超越前人且不牺牲通用质量。对海报文字艺术、AI 肖像画等场景有直接推动。 |

**原文摘要：** InsightTok 通过局部化、内容感知的感知损失增强文字和人脸保真度。在紧凑 16k 码本和 16 倍降采样率下显著优于先前分词器，增益一致迁移到 InsightAR 自回归图像生成模型，生成文字更清晰、面部细节更逼真的图像。

**完整文章：** [articles/art/insighttok-ar-generation.md](art/insighttok-ar-generation.md)

**相关链接：**
- arXiv: [https://arxiv.org/abs/2605.14333](https://arxiv.org/abs/2605.14333)

---

#### 📄 15. 合成数据能否改善图形设计的层次解构？

| 字段 | 内容 |
|------|------|
| **标题** | Does Synthetic Layered Design Data Benefit Layered Design Decomposition? |
| **作者** | Kam Man Wu, Haolin Yang, Qingyu Chen, Yihu Tang, Jingye Chen, Qifeng Chen |
| **来源** | arXiv (cs.CV) |
| **日期** | 2026-05-14 |
| **论文** | [arXiv:2605.15167](https://arxiv.org/abs/2605.15167) |
| **模块** | 🎨 视觉艺术 → 平面设计 / 自动化设计编辑 |
| **推荐理由** | 系统验证纯合成分层数据在图形设计解构中的可行性和优越性。构建 SynLayers 合成数据集，VLM 自动化标注管线。三个关键发现：纯合成数据超越真实数据、5 万样本达到饱和、合成数据可平衡层数分布。为 AI 设计工具的「生成→解构→编辑」工作流提供数据基础。 |

**原文摘要：** 研究纯合成分层数据能否改善图形设计分解。基于 CLD 基线构建 SynLayers 合成数据集，使用 VLM 生成文本监督和边界框。实验表明纯合成数据可超越 PrismLayersPro 真实数据集，5 万样本后趋于饱和，合成数据可平衡层数分布。

**完整文章：** [articles/art/synthetic-layered-design.md](art/synthetic-layered-design.md)

**相关链接：**
- arXiv: [https://arxiv.org/abs/2605.15167](https://arxiv.org/abs/2605.15167)

---

#### 📄 16. 带用户约束的图像感知海报布局生成

| 字段 | 内容 |
|------|------|
| **标题** | Image-aware Layout Generation with User Constraints for Poster Design |
| **作者** | Chenchen Xu, Kaixin Han, Weiwei Xu |
| **来源** | arXiv (cs.GR) |
| **日期** | 2026-05 (更新) |
| **论文** | [arXiv:2605.13856](https://arxiv.org/abs/2605.13856) |
| **模块** | 🎨 视觉艺术 → 平面设计 / 海报生成 |
| **推荐理由** | 提出支持用户自定义约束的可控布局生成框架：支持布局属性约束（包含/排除特定元素类别）和部分布局约束（利用不完整布局引导剩余元素）。高斯噪声属性表示+双重损失设计+随机掩码增强，在自动海报设计任务上达到最优性能。直接服务于 AI 辅助平面设计。 |

**原文摘要：** 利用深度学习模型自动生成带用户定义约束的图像感知布局。模型以不同均值的高斯噪声表示不同布局属性，提出属性一致性损失和属性解耦损失。部分布局约束通过随机掩码增强多样性，鼓励模型学习通用潜在表示。定量定性评估达 SOTA。

**完整文章：** [articles/art/image-aware-layout-poster.md](art/image-aware-layout-poster.md)

**相关链接：**
- arXiv: [https://arxiv.org/abs/2605.13856](https://arxiv.org/abs/2605.13856)

---

### 待收录推荐方向

> 📝 以下为尚未收录的推荐方向，欢迎通过 GitHub Issues 补充完整文章信息。

1. **"Eliza effect" in AI Art** — 用户对 AI 艺术作品的拟人化感知
   
2. **DALL·E / Midjourney / Stable Diffusion 技术对比分析**
   - 主流文本到图像模型的技术演进

3. **Generative AI and Copyright** (U.S. Copyright Office)
   - AI 生成内容的版权登记政策演变

4. **Can AI be Creative?** (Margaret Boden)
   - AI 创造力的哲学与认知科学探讨

5. **The Work of Art in the Age of Mechanical Reproduction** → **AI Reproduction**
   - 从本雅明到 AI 时代：机械复制到智能生成

6. **"The Cult of the Lost Genius" in AI Art** (Hito Steyerl)
   - AI 艺术中的原创性神话批判

---

*本文档持续更新。建议通过 CNKI、arXiv、Google Scholar 等平台检索最新文献。*
*收录标准：具有学术深度或行业影响力的 AI 艺术相关文章、论文、评论。*
