C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  上尉

注册:2007-10-2911
发表于 2025-3-20 09:38:52 |显示全部楼层

马斯克也要打造自己的视频生成模型了??

就在最近,xAI收购了一家视频生成初创企业,这家仅4个人的企业过去两年打造出了Hotshot这款产品。

亚星游戏官网-yaxin222



据公告先容,Hotshot至今已有3款视频生成基础模型。被收购之后,目前已停止推出新的视频创作功能,而且用户过往创作的视频截止下载时间为3月30日。

一看这架势,网友们纷纷想起了老马在今年1月的一场直播活动中掷下的豪言:

  • 预计将在几个月内发布Grok视频模型
而且就在Hotshot联创&CEO公布上述消息之后,老马也第一时间跑来卖关子:

  • 酷炫视频AI即将到来!
亚星游戏官网-yaxin222



期待值被拉满的同时,众人也齐刷刷表达了对Hotshot团队的祝贺:

亚星游戏官网-yaxin222



那么,这是一家怎样的团队呢?为什么它能被马斯克“看上”?

答案这就揭晓——

4人团两年打造“Sora”

概括而言,Hotshot之所以能入老马的眼,原因显然在于两方面:

一是“小团队也有大能量”,据悉Hotshot团队一共只有4个人,但他们在13个月里连续训练出了3个视频生成模型,且获得了一定程度的用户关注;二是虽然成立不久,但投资者中不乏Reddit联合创始人Alexis Ohanian等大佬

从Hotshot官网公布的信息来看,这个4人小团队在两年时间里成功打造出了“Sora”模型。

亚星游戏官网-yaxin222



4人中有两位是联合创始人。

联创&CEOAakash Sastry(右边),和另一位联创&CTOJohn Mullan(左边)早在2012年就相识了。

亚星游戏官网-yaxin222



认识之前,前者正在构建一个视频聊天应用,后者正在尝试打造视觉通讯应用(visual communication apps)。

不过,在看到Aakash Sastry的视频聊天应用失败之后(本以为是很酷的想法,结果可能因为理念超前,大家很害怕视频通话),两人一致意识到:

  • 大家需要创造一个让人们在网上表达自己的同时,也感到舒适和自由的环境。
于是,Hotshot逐渐诞生了。

2017年,两人共同成立了一家企业——Natural Synthetics(Hotshot背后企业),开始构建各种不同的社交应用。

到了2023年1月,他们正式在iOS应用商店发布了Hotshot。

不过需要注意,Hotshot一开始并不是做AI视频生成,而是图片生成

基于开源的图片生成模型Stable Diffusion,Hotshot为用户免费提供个人、朋友甚至是名人的图片。

亚星游戏官网-yaxin222



△两位创始人在Hotshot应用中创建的图片

直到后来逐渐被视频生成吸引,因此他们又开始训练视频生成模型。

和之前类似,一开始他们也打算基于开源模型构建,不过后面意识到:1)基础模型需要大幅改进;2)为了自由构建引人入胜的用户体验,需要对底层模型拥有控制权。

于是,他们正式决定自研视频模型

在过去的13个月里,他们训练了3个不同的视频模型:

  • 第一个Hotshot-XL:耗时3个月开发,每秒生成8帧视频,开源后至今每月约有2万名新的开发者和艺术家使用;
  • 第二个Hotshot Act-One:耗时5个月开发,生成3秒8fps的视频,基于2亿个公开视频训练而成;
  • 第三个Hotshot:耗时4个月开发,生成最长10秒的720p视频,限文生视频。
按照Hotshot发布时的说法,在各种提示评估中,70%的情况下用户更喜欢Hotshot的结果,而不是其他开源文生视频模型。

亚星游戏官网-yaxin222



另外,从CEO Aakash Sastry公布的消息来看,Hotshot的投资者包括Stripe前高管Lachy Groom、Reddit联合创始人Alexis Ohanian以及SV Angel在内的风险投资机构。

至于具体融资次数和规模,Hotshot尚未公开披露,而且也不清楚整个Hotshot团队是否会集体加入xAI

亚星游戏官网-yaxin222



马斯克想开发自己的视频生成模型?

事实上,早在今年1月,马斯克在一场直播活动中就透露了自研视频生成模型的想法:

(指路原推文视频15:02)

亚星游戏官网-yaxin222



对于自家的Grok模型一直没有视频生成功能这事儿,老马本人和用户都不太满意。

而要解决这个问题,通常来说有两条路可走:

要么直接接入其他家模型,要么自研。

从Grok之前的一些倾向来看,他们主要选择第一种方案,比如其Grok-2的文生图功能,就是通过与此前备受瞩目的Flux深度融合实现。

然而现在,老马明显转向了。

为了和OpenAI、GOOGLE等展开长期竞争,xAI最终也是走上了自研之路,开始通过收购进一步布局。

不过不管怎样,对于大家普通用户来说,期待Grok的视频生成功能就完事了!

亚星游戏官网-yaxin222




来源:网易

举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2025-3-26 14:34 , Processed in 0.199083 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图