老米吧 关注:17,743贴子:1,034,522
  • 5回复贴,共1

谷歌Genie爆打Sora,基础世界模型AGI来了?

只看楼主收藏回复

真正的「基础世界模型」诞生了!谷歌团队发布110亿参数Genie「精灵」,从一张图片就能创造出可玩的虚拟世界,动作可控碾压Sora。网友惊叹,AI已经杀到视频游戏领域了。
就在昨天,谷歌DeepMind重磅发布了一个基础世界模型——Genie「精灵」。
从一个图像,一张照片,一个草图中,它就能生成一个无穷无尽的世界。


IP属地:浙江1楼2024-02-27 17:30回复
    Genie的疯狂之处在于,学习了20万小时的未标注互联网视频,无需监督即可训练。
    无需任何动作标注,便可以确定谁是主角,并让用户能够在生成的世界中对其控制。
    凭借110亿参数,Genie确立了自己作为基础世界模型的地位。
    因此,Genie为培养未来的通才智能体开辟了崭新的途径,重塑了交互式生成环境的格局。
    举例:
    把孩子们的画作输入Genie,然后就看到老鹰在空中飞来飞去了。一张静态图片瞬间就成自由飞翔的动画片。
    AI的发展彻底杀疯了,,技术似乎在不可控制的速度上发展,,,


    IP属地:浙江2楼2024-02-27 17:34
    回复
      谷歌称,虽然Genie目前的展示主要在游戏上,但其未来应用远不止于此。
      它是一个通用的工具,能够跨越多个领域,而且不需要额外的专业知识就能使用。
      就比如,在机器人领域,Genie模型能够让其处理现实世界中的一些任务。
      研究人员使用来自RT1的无动作视频训练了一个较小的2.5B模型。
      正如在平台游戏中所见,相同动作序列的行为轨迹,通常会表现出相似的模式。
      这意味着Genie能够掌握一组统一的动作模式,这对于训练能够在现实世界中灵活应对各种情境的AI智能体来说,具有重要意义。
      Genie还能够模拟可变形物体,这是一个对传统由人设计的模拟器来说颇具挑战的任务,但Genie能够通过分析数据学会如何做到这一点。


      IP属地:浙江4楼2024-02-27 17:38
      收起回复
        能不能做点别的东西。比如一条河要修一座大桥,把水文地质数据和要求输进去。就自动把大桥设计出来。这样大量的土木建筑工程师要失业了


        IP属地:江苏6楼2024-02-27 17:45
        收起回复