首页
抖音
B站
老司机
热门
网络
投稿
首页
抖音
B站
老司机
热门
网络
互联网梗百科
SimpleFold
SimpleFold 是苹果公司推出的轻量级蛋白质折叠预测 AI 模型。模型基于流匹配(Flow Matching)技术,跳过多序列比对(MSA)等复杂模块,直接从随机噪声生成蛋白质的三维结构,大幅降...
查看更多
多多影视
10-05
AudioFly
AudioFly 是科大讯飞开源的文本生成音效的AI模型。模型用潜在扩散模型架构,拥有10亿参数,通过大量开放数据集(如AudioSet、AudioCaps、TUT)及内部专有数据训练而成。Audio...
查看更多
M-N
10-05
StableAvatar
StableAvatar 是复旦大学、微软亚洲研究院等推出的创新音频驱动虚拟形象视频生成模型。模型通过端到端的视频扩散变换器,结合时间步感知音频适配器、音频原生引导机制和动态加权滑动窗口策略,能生成无...
查看更多
戌尻リップの
10-05
GDPVAL
GDPval 是 OpenAI 推出的全新评估框架,用在衡量 AI 模型在真实经济价值任务上的表现。GDPval 从美国 GDP 贡献最大的 9 个行业中选取 44 种职业,设计 1320 个真实任务...
查看更多
Sia Siberia
10-05
混元3D-Omni
混元3D-Omni(Hunyuan3D-Omni)是腾讯混元3D团队提出的3D资产生成框架,通过多种控制信号实现精准的3D模型生成。基于Hunyuan3D 2.1架构,引入了统一的控制编码器,可处理点...
查看更多
奶兔
10-05
混元3D-Part
混元3D-Part是腾讯推出的3D生成模型,由P3 – SAM和X – Part组成,首次实现高精度、可控的组件式3D生成,支持50 + 组件自动生成。用户可先用混元3D 2.5或3.0生成整体Mes...
查看更多
angelabarbie
10-05
CoF
CoF(Chain-of-Frames,帧链)是DeepMind推出的新概念,类比于语言模型中的“链式思维”(Chain-of-Thought,CoT)。CoF使视频模型能在时间和空间上进行推理,通过...
查看更多
nikibaby
10-05
Manzano
Manzano是苹果公司推出的新型多模态大语言模型(LLM),能同时实现图像理解和图像生成的统一。模型通过混合视觉分词器(hybrid vision tokenizer)将图像转化为连续的嵌入向量用于...
查看更多
sexysasa
10-05
KAT-Dev-32B
KAT-Dev-32B 是快手 Kwaipilot 团队发布的开源代码智能大模型,拥有 32 亿参数。在 SWE-Bench Verified 基准测试中取得了 62.4% 的解决率,排名第 5。模型...
查看更多
白乃菟Nettie
10-05
KAT-Coder
KAT-Coder 是快手旗下 Kwaipilot 团队发布的闭源旗舰代码生成模型,具备强大的编程能力。能高效完成功能开发、缺陷分析、单测生成等任务,支持多种编程语言,如 Python、JavaScr...
查看更多
amyqueen
10-05
JoySafety
JoySafety 是京东开源的大模型安全框架,为企业提供成熟、可靠、免费的大模型安全防护方案。模型基于多种原子能力模块(如 BERT、FastText、Transformer 等)和灵活的架构设计,...
查看更多
Brandi Love
10-05
Lynx
Lynx 是字节跳动推出的高保真个性化视频生成模型,仅需单张人像照片,能生成身份一致的视频。基于扩散 Transformer(DiT)基础模型构建,引入 ID-adapter 和 Ref-adapte...
查看更多
Candy Love
10-05
下一页