中文性能排名第一!通义千问2.5大模型来了
在人工智能领域,一场技术革新正悄然改变我们的工作与生活方式。在学习AI模型、使用免费的“ChatGPT”的时候,大家都会碰到这样的一个场景:不给你内测资格,天天给你发短信,各种注册他们的网站,有时候还得参加他们的会议,不然没有内测资格作者获得授权。
5月9日,阿里云正式宣布了通义千问2.5大模型的面世,相比上一版本,2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界,全面赶超GPT-4。
同时还开源了Qwen1.5-110B,可免费商用,直接啪啪打脸其他AI模型。
更可恶的就是,很多企业是借着AI大模型的名义,在圈自己的私域流量,做自己的用户,把用户当猴耍。
这回好了,通义发布了1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,我们可以在AI的模型里开上"保时捷"了。
什么是通义千问?
通义千问是阿里云推出的一款超大规模语言模型,它具备多种强大功能,包括多轮对话、文案创作、逻辑推理、多模态理解以及多语言支持。这个模型能够与人类进行多轮交互,并且能够理解多种形式。
更重要的是,阿里坚持了自己的开源原则,这回,阿里云没有藏着掖着,而是真正掏出了家底,感觉他们也不通过这个赚钱,如果获得认可,用户,必将成为用户体量最大的一个AI大模型。
目前市面上几十种AI大模型,市场太乱了,从业者无从下手。阿里的大模型可能给你带来很一个学习AI模型的学习机会。
在国外,OpenAI选择的就是闭源路线,除了ChatGPT,没有具体的产品应用,对外则通过提供API接口和投资的方式繁荣生态。Meta旗下的大模型Llama系列则选择了开源,用开源生态加速Llama的迭代和升级。在国内,例如BAT三巨头,腾讯云和百度云的大模型采用的是闭源路线,阿里云则选择了开源+闭源路线。
体验网址:
https://tongyi.aliyun.com/gianwen/
全栈能力开放,实测体验
伴随着通义千问2.5的发布,通义APP也完成了全面升级并更名,以“All in one”的理念,免费向用户提供包括文生图、智能编码、文档解析、音视频理解、视觉生成等在内的全栈能力。
1、上传文档、图片
最近,通义千问调整了下产品逻辑,将文档、图片上传功能直接放在了对话框的旁边。
文档,一次对话,可以同时上传100个文件(每个150MB),支持PDF、word、excel、Mardown、EPUB、Mobi、txt等格式。
其中,Mardown文档一般后缀为.html或.md格式,EPUB和Mobi则是电子书的格式。
图片,每次上传1张不超过10M,支持jpg和png格式。
2、写代码
演示一段用Java写Websocket的代码演示:
3、除了写代码,还能诊断bug
还有一些趣味功能可参考“百宝袋”:
行业应用
通义千问2.5的发布,使其在实际应用中的潜力得到了广泛的认可。阿里云已通过通义大模型服务超过9万家企业,涉及PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等多个领域。
这种广泛的应用显示了其强大的市场适应性和实际操作能力,也说明了其技术的成熟度和业务的广泛性。
通义千问2.5的发布还带来了一个令市场瞩目的合作消息——与小米的深度合作。阿里云与小米的合作旨在将通义千问的强大AI能力整合到小米的智能设备中,包括小米手机和小米汽车等。此举不仅将提升小米设备的智能交互功能,也预示着通义千问大模型在消费电子产品中的广泛应用。
通过这种合作,用户将能在日常使用中体验到更加智能化的问答、图片编辑等多模态AI功能,这将大大提升用户的使用体验和生活便利性。这一战略合作标志着AI技术在消费级市场的深入应用,也显示了通义千问技术的成熟度和实用性。
AI大模型谁更胜一筹?
文心一言,讯飞星火,通义千问,这三家国产AI大模型,谁更有前途?先给结论,我认为通义千问更有前途。
首先我们来看看这几个厂家的大模型应用场景。
百度的文心一言。百度是to c起家,目前文心一言还是面对的to c消费者。当前他的应用场景就是文心一言app和用于检索rag。
再看讯飞星火,讯飞做大的场是教育,当然目前国家在推荐大模型落地教育,但是在教育中能起到什么样的作用这个还不好说。
最后看阿里云的通义千问。阿里云当前的业务场景是tob,首先tob场景就有很多智能化的能力可以做,tob的购买能力本身就很强。只要真的做出有价值的事情,他们肯定是有购买动力的,本身阿里云在国内都是云业务第一的。而且阿里云本身的技术研发实力还是很强的,通义千问体验过,效果整体还是不错的。所以相比其他两家,阿里云无论从面对的客户的购买力,还是自身的处境,他都是更领先的。
白丁学者 » 中文性能排名第一!通义千问2.5大模型来了