首页
抖音
B站
老司机
热门
网络
投稿
首页
抖音
B站
老司机
热门
网络
LLaVA-OneVision-1.5
LLaVA-OneVision-1.5 是开源的多模态模型,通过高效训练和高质量数据实现高性能、低成本和强复现性。采用自研的 RICE-ViT 作为视觉编码器,结合 2D 旋转位置编码和区域感知注意力...
查看更多
渔亦声
10-16
Qwen3-VL Cookbooks
Qwen3-VL Cookbooks 是阿里推出的为 Qwen3-VL 模型设计的实用指南集合,帮助用户快速掌握和应用该模型的各种功能。集合涵盖多种能力的使用示例,包括物体识别、文档解析、视频理解、空...
查看更多
黑椒盖饭
10-13
Qwen3-TTS-Flash
Qwen3-TTS-Flash 是阿里通义推出的支持多音色、多语言和多方言的旗舰语音合成模型。模型具备卓越的中英语音稳定性,出色的多语言性能,及高表现力的拟人音色。模型提供 17 种音色选择,每种音色...
查看更多
蛇信子姐姐
10-07
MiroThinker
MiroThinker 是开源的智能体模型系列,专为深度研究和复杂、长期问题解决设计。模型基于 Qwen3 构建,具备任务分解、多跳推理、检索增强生成、代码执行、网页浏览和文件处理等能力。MiroTh...
查看更多
Xreindeers
08-12