首页
抖音
B站
老司机
热门
网络
投稿
首页
抖音
B站
老司机
热门
网络
互联网梗百科
Game-TARS
Game-TARS是字节跳动Seed团队开发的通用型游戏智能体,基于统一的键盘-鼠标动作空间训练,可在操作系统、网页与模拟环境中进行大规模预训练。依托超5000亿标注量级的多模态训练数据,结合稀疏推理...
查看更多
Eliza Ibarra
11-09
LTX-2
LTX-2 是 Lightricks 开发的先进 AI 视频生成模型,专为高质量视频创作设计。能以原生 4K 分辨率和 50fps 的帧率生成电影级视频,支持多模态输入,包括文字、图片和草图,同时提供...
查看更多
啵啵梨
11-09
WOWService
WOWService 是美团 LongCat 团队发布的智能交互系统,通过融合大型语言模型(LLMs)和多智能体架构,优化用户体验并降低成本。系统针对智能交互领域的五大挑战:冷启动数据构建、多轮对话性...
查看更多
404HotFound
11-09
Aardvark
Aardvark 是 OpenAI 推出的基于 GPT-5 的智能体,能自动发现和修复代码中的安全漏洞。Aardvark通过不间断地分析源代码仓库,识别漏洞、评估可利用性、划分严重等级,提出针对性修复...
查看更多
ninabebe
11-09
Music 2.0
Music 2.0 是MiniMax最新推出的先进音乐创作模型。模型能精准捕捉和还原人声的细腻情绪与器乐的动态张力,支持多种唱法和风格切换,如流行、爵士、摇滚等,还能实现男女对唱、阿卡贝拉等效果。模型...
查看更多
小千绪
11-09
Kimi Linear
Kimi Linear 是月之暗面推出的新型混合线性注意力架构,专为提升大型语言模型(LLMs)在长序列任务中的效率和性能设计。核心组件 Kimi Delta Attention(KDA)通过精细化的...
查看更多
青稞直播
11-09
Firefly Image 5
Firefly Image 5 是 Adobe 发布的最新图像生成模型。具备原生400万像素输出能力,能直接生成高分辨率图像,细节表现力大幅提升。在人物渲染方面,新模型优化了面部结构、肢体比例和光影逻...
查看更多
larababe
11-09
Composer
Composer 是Cursor推出的自研编码模型,专为低延迟的智能体式编码设计。模型生成速度极快,每秒可达 250 个 token,是同等智能模型的 4 倍,大多数任务在 30 秒内完成。Compo...
查看更多
florababy
11-09
Sonic-3
Sonic-3是Cartesia最新发布的语音AI引擎,是当前市场上速度最快、最自然的实时语音对话模型。采用创新的“状态空间模型”(SSM)架构,非传统的Transformer模型,能更有效地模拟人类...
查看更多
美剧窝
11-09
FIBO
FIBO 是首个开源的原生支持 JSON 的文本生成图像模型,专为长结构化描述训练而成。模型在超过 1 亿条结构化 JSON 描述(每条约 1,000 字)上训练,能精确、可重复地控制光线、构图、色彩...
查看更多
unapussy
11-09
Handy
Handy 是开源的语音转文字桌面应用,完全离线运行,支持 Windows、macOS 和 Linux 系统。由 Rust 和 React/TypeScript 构建,界面简洁,操作便捷。用户通过快捷...
查看更多
徐媛媛
11-09
NavFoM
NavFoM(Navigation Foundation Model)是银河通用联合北京大学、阿德莱德大学、浙江大学等团队发布的全球首个跨本体全域环视导航基座大模型。具备全场景支持能力,可同时适用于室...
查看更多
Kristen Scott
11-09
下一页