OpenAI 发布的最新型号 Sora 2产生远远超过传统一代人工智能的逼真视频和音频。
同时发布的新应用 Sora 具有客串功能,可以让你和你的朋友出现在 TikTok 风格的动态中。我们将详细介绍因创新性和安全性而备受关注的 Sora 2 和应用程序。
内容
索拉2来了。pic.twitter.com/hy95wDM5nB
— OpenAI (@OpenAI)2025 年 9 月 30 日
OpenAI 发布了最新的视频和音频生成模型“Sora 2”以及新的 TikTok 型社交应用程序“Sora”。两者相互关联,作为结合生成 AI 和 SNS 体验的新框架而受到关注。
Sora 2的主要进化点
Sora 2的最大特点是它可以忠实地再现传统一代AI难以做到的身体行为,并生成逼真的视频。
例如,如果篮球投篮未命中,它会自然反弹,从而改善以前模型中被错误地描述为隐形传送的运动。
它还具有同时生成音频和视频的能力,让您将环境声音、对话、音效等与高水平的现实融为一体。这使得创作带有故事的作品变得更加容易,而不仅仅是单个视频。
此外,可以生成的风格范围也扩大了,从逼真的图像到电影风格,甚至动漫风格。它可以高精度响应用户指令,从而可以制作跨多个剪辑的视频并保持一致的世界观。
- 物理定律的再现性:自然的动作和失败的表达
- 音频同步:真实生成音效和对话
- 多种风格:从写实风格到动漫风格
- 可控性高:支持多次剪切和复杂指令
这些进步预计不仅将为创作者拓展新的视觉表达选择,还将应用于教育、模拟和娱乐领域。
新应用程序“Sora”的特点和用法
同时发布的iOS应用程序“Sora”是一种SNS类型的服务,您可以在其中分享和欣赏您创建的视频。最大的特点是“客串”功能,用户可以通过一次音频/视频注册来捕捉自己或朋友的图像,并将它们出现在人工智能生成的视频中。
在该应用程序中,您可以重新混合您与其他人创建的视频,并在专用源中发现新的创作。虽然格式与 TikTok 和 Instagram Reels 类似,但 Sora 的设计理念强调创造力而不是时间消耗。
| 功能 | 特征 |
|---|---|
| 客串功能 | 您可以让自己或您的朋友出现在生成的视频中。 |
| 混音 | 您可以编辑和重建其他人生成的视频。 |
| 喂养 | 配备强调创意的视频推荐算法 |
| 利用开始 | iOS 在美国和加拿大仅限受邀者推出,日本版本尚未确定 |
目前,该服务仅在美国和加拿大受邀推出,预计未来将扩大在日本的服务范围。 ChatGPT Pro用户可以单独使用该模型,因此国内用户或许也可以提前访问。
背景及发展历程
Sora 2 不仅仅是一个更新;它还是一个更新。它代表了生成式人工智能的演变。基于第一代Sora面临的问题,我们通过显着改善其物理行为和可控性,进入了视频生成AI的新阶段。
从Sora 1到Sora 2的演变
Sora于2024年2月出现,是视频生成领域第一个显示出实用迹象的模型。虽然在某种程度上能够再现物体的位置和持久性是一个重大进步,但物理定律的再现还不够,而且图像缺乏一致性的问题仍然存在。
Sora 2 对此进行了极大的改进,并且已经发展到 OpenAI 自己将其描述为“从 GPT-1 到 GPT-3.5 的飞跃”。现在可以再现自然动作,包括错误和复杂的运动表演,大大增加了图像的真实感。
此外,值得注意的是,指令的准确性得到了提高,并且可以将多个剪辑生成为连续视频。这有可能极大地改变电影和动漫的制作过程。
- 第一代Sora的特点:我们能够再现物体的持久性和简单行为,但有很多不自然的描述。
- 索拉进化2:可以实现复杂的物理行为、音频同步和多个剪辑的集成
- 评估:这种模式将成为从实验阶段扩展到商业和创意用途的转折点。
定位为世界模拟
Sora 2不仅仅是一个创建图像的工具,而是被定位为OpenAI“理解世界的AI”的基础。让AI理解现实世界的物理和因果关系,将直接关系到未来通用AI和机器人技术的发展。
特别是,仿真能力可应用于教育、科学研究、城市设计等广泛领域。例如,可以虚拟地再现现实世界中成本高昂且存在风险的情况,例如灾难期间的疏散模拟和新产品的行为验证。
此外,它还可以应用于创意领域的动画制作、广告视频、游戏开发等,因此有可能极大简化传统的制作流程。
| 领域 | Sora 2 的潜在应用 |
|---|---|
| 教育 | 物理现象和科学实验的安全虚拟体验 |
| 研究与开发 | 仿真在产品测试和城市设计中的应用 |
| 娱乐 | 提高动漫、电影、游戏制作效率 |
| 社会制度 | 用于灾害对策、交通模拟等 |
Sora 2超越了“视频生成AI”的框架,并作为理解和再现现实的重要基础技术而不断发展。
Sora 应用程序提要设计和安全措施
新应用程序“Sora”不仅仅是一个视频 SNS,它还具有独特的提要设计和以创造力为中心的安全措施。为了提供用户安心使用的环境,内置了从算法到家长控制的多层系统。
强调创造力的饲料理念
传统的SNS往往强调“观看时间”,并进行了优化,让用户可以无休止地持续观看视频。然而,Sora 扭转了这个想法,并引入了一个提要,其目的是鼓励创作和参与。
这就推出了一种将用户体验从被动消费转变为主动表达的设计理念。
用户可以使用自然语言自定义提要,如果您说“我想增加动漫风格视频的数量”之类的话,它将反映在排名中。
此外,个性化优化是根据用户的发帖、关注、评论等行为进行的,其特点是可以灵活地根据个人喜好进行微调。
- 创造性重视:优先考虑视频制作和参与而不是滚动。
- 用户控制:您可以使用自然语言指定您的偏好并调整算法。
- 加强联系:通过 Cameo 功能促进与朋友和家人合作创作内容
由于这种方法,与其他SNS相比,它强调“丰富体验”而不是“上瘾”,并且它的突出之处在于它的目标是健康的使用文化。
家长控制和安全指南
Sora特别强调对未成年用户的考虑。家长可以禁用提要个性化并限制应用程序内的连续滚动。
此外,还引入了一个系统,对一天可以观看的视频数量进行限制,旨在防止过度使用。
另一个特点是从内容生成阶段就保证安全。宣扬性表达、过度暴力、仇恨内容或危险行为的帖子将在系统级别被屏蔽。
此外,除了自动过滤器之外,我们还有人工审核团队来监控不当帖子。
| 安全策 | 具体机制 |
|---|---|
| 针对未成年人的措施 | 观看限制、客串使用限制、家长反馈控制 |
| 消除有害内容 | 生成阶段自动护栏+主持人监控 |
| 肖像权保护 | 使用 Cameo 需要获得个人的明确许可,并且可以随时撤销。 |
| 利用者通报 | 为用户提供举报不当帖子的机制 |
通过这些机制,Sora 设计的用户体验强调“安全与自由之间的平衡”。我们正在呈现一种新形式的 SNS,它遵循适合社会的准则,但不会因过多的限制而阻碍创造力。
与竞争服务的比较和行业影响
虽然 Sora 应用的目标是与 TikTok 和 Instagram Reels 处于同一短视频领域,但它的设计理念和安全措施明显与众不同。尤其是“强调创造和参与的SNS”与依赖被动消费的传统平台有很大不同。
Sora vs TikTok/Instagram/Meta
在短视频市场,TikTok凭借算法病毒式传播确立了压倒性地位,Instagram Reels紧随其后。 Meta 还添加了“Vibes”,并推出了新的人工智能视频源。
针对这些,Sora专注于生成式AI,并强调允许用户将自己融入视频和安全机制的客串功能。
下面的比较表总结了与主要 SNS 的差异。
| 服务 | 设计思想 | 特色功能 | 安全措施 | 收入模式 |
|---|---|---|---|---|
| 索拉 | 强调创造力和参与性 | 客串功能,AI生成视频混音 | 未成年人限制,内容生成阶段自动防护 | 基本免费,需求旺盛时额外收取发电费 |
| 抖音 | 最大化观看时间 | 强大的传播算法 | 专注于事后删除支持 | 主要是广告模式 |
| Instagram 卷轴 | 与现有SNS联动 | Facebook/Instagram 合作 | AI审核+举报系统 | 广告收入 |
| 元氛围 | 人工智能驱动的娱乐源 | 主要是自动生成的视频 | 符合服务条款的过滤器 | 未来发展未定 |
Sora 的与众不同之处在于,它将“视频参与和创作”置于 SNS 的核心,而不仅仅是“视频观看”。通过允许用户自己出现,我们正在实现传统平台无法获得的体验。
这不仅有可能影响娱乐,还可能影响教育和远程互动等广泛领域。
对于整个行业来说,毫无疑问,融入AI生成的SNS的出现将加速未来的竞争。平台公司面临的一大挑战将是如何平衡安全性、创造力和货币化。
对日本市场和用户体验的影响
Sora应用程序和Sora 2的推出将对日本消费者和企业产生巨大影响。尤其是在目前TikTok、Instagram广泛受到年轻人欢迎的情况下,新的生成型AI型SNS将如何被接受将受到关注。
在日本扩张的可能性和监管问题
OpenAI 目前正在美国和加拿大推出该应用程序,但正在寻求扩展到其他国家,包括日本。然而,进军日本市场时,无法回避个人信息保护法、肖像权等问题。
Cameo功能需要注册用户的脸部和声音,因此如果数据处理不透明,可能会引起用户的焦虑。
此外,人工智能生成的内容存在深度伪造等滥用风险,日本也需要法律框架和使用指南。
特别是,由于担心社交媒体成瘾和不当内容的传播,将需要对未成年用户的使用制定更严格的规则。
- 监管墙:遵守个人信息保护法、肖像权、未成年人保护的必要性
- 社会的悬念:深度造假的风险和错误信息的传播
- 展开时期:根据美国和加拿大的结果,日本有可能进入第二阶段及以后的阶段。
对日本用户的价值
另一方面,Sora可能会给日本用户带来新的体验价值。传统的 SNS 侧重于被动观看视频,而 Sora 则允许用户自己采取主动,通过生成和分享视频来获得创意体验。
它还可以用于教育、企业培训和营销领域。例如,如果公司可以轻松制作以公司角色或员工为特色的视频,那么新的广告和促销形式就会出现。
| 使用场景 | 预期效果 |
|---|---|
| 个人利用 | 与亲朋好友一起制作视频,SNS新体验 |
| 教育 | 制作教材视频和虚拟课堂,让学生亲自出现 |
| 企业 | 加强将员工和产品结合起来的广告和促销 |
| 娱乐 | 粉丝参与内容和用户生成的活动 |
为了享受这种价值,拥有可以安心使用的安全设计至关重要。 OpenAI 在日本的传播将取决于 OpenAI 的透明度和可靠性。
Sora 2 和应用程序展望的未来和挑战
Sora 2 和 Sora 应用程序具有生成人工智能的潜力,可以极大地改变 SNS 的工作方式。视频生成和新社交体验的进步将对未来的数字文化和商业产生广泛影响。
预期未来形象
Sora 2 推进了视频表达的民主化,即使没有专业技能的人也能创作出高质量的视频。这将极大地提高个人在SNS上发布的内容的质量,并扩大自我表达和创造力的范围。
在教育环境中,将可以生成学生自己出现的教材视频和虚拟场景,并将其用作加深学习体验的手段。
此外,在娱乐行业中,粉丝参与的内容和协作视频制作将成为可能,从传统的单向分发演变为双向关系。
此外,它还兼容虚拟世界和VR领域,可以成为丰富虚拟空间中的自我表达和联合体验的基础技术。
- 增强自我表达:任何人都可以生成电影图像
- 教育应用:自动生成教材和培训视频
- 娱乐进化:实现粉丝参与的新体验
- 元宇宙合作:虚拟空间中存在感和互动的扩展
剩余风险及未来关注点
另一方面,Sora也面临着严重的风险。特别是,将人脸和声音融入人工智能的客串功能,如果使用不当,可能会加剧深度造假问题。
目前有同意和撤销功能,但实际操作效果如何尚不得而知。
生成的视频也很有可能被用于错误信息或诽谤,从而可能使监管机构和平台承担责任。
平衡言论自由和安全并不是一个容易解决的问题。此外,社交媒体成瘾及其对未成年人的负面影响仍然是令人关注的领域。
| 风险区域 | 具体问题 | 反应显着 |
|---|---|---|
| 深假 | 未经同意的视频制作造成的损害 | 完善的肖像权管理和删除系统 |
| 传播错误信息 | 虚假视频造成社会混乱 | 透明的归属和审核 |
| 未成年利用 | 成瘾和接触有害内容 | 增强的家长控制 |
| 收入模式 | 将利润优先于用户利益的可能性 | 强调用户福利的计费系统 |
未来,包括日本在内的各国法律体系和行业准则将对Sora的发展产生重大影响。
OpenAI如何透明地实施安全措施将是Sora 2和应用程序可持续发展的关键。虽然这是一项令人惊叹的技术进步,但最大的焦点在于它能否获得社会信任。
关于我
