【大模型本地部署】在Mac安装Ollama并体验Qwen2.5-VL 7B视觉模型，零基础也能学会！

Source

前几天在 Mac 上安装了 Ollama，并下载了 Qwen2.5-VL 7B 做了一些测试，整个过程还挺有意思，分享给大家。

一、Mac 安装 Ollama

进入 Ollama 官网，我的电脑是 Mac Studio ，所以选择 MacOS 下载。

image-20251115204120250

下载完成后，双击安装，安装完成后界面如下图：

二、下载 Qwen 2.5 VL 7B

Qwen 2.5-VL 是阿里巴巴通义千问团队开发的一款开源的旗舰级视觉语言模型。

它能够处理文本、图像和视频，并具备强大的视觉理解和交互能力。该模型有不同参数规模（如 3B、7B 和 72B），适用于从边缘 AI 到高性能计算的多种场景。

下载 Qwen 2.5 VL 有两种方式：

1、通过命令行请求

ollama pull qwen2.5vl:7b

2、通过 Ollama GUI 界面安装

在 GUI 界面选择模型，若未下载会显示下载图标，然后在对话框中输入任意文本即可自动下载。

三、文本/图片体验

下载完模型后，即可在对话框中进行对话。

当然我们也可以通过 ollama 启动模型后展开对话：

ollama run qwen2.5vl:7b

接下来，进行图片检测，图片如下：

检测结果：

我们也可以通过该模型识别图像中的文字、公式或抽取票据、证件、表单中的信息，支持格式化输出文本：

四、程序调用分析图片

我们可以编写 python 调用 Ollama 接口，实现模型分析图片：

Ollama 提供兼容 OpenAI 协议的接口，实现流式对话。```plaintext
curl http://localhost:11434/api/chat -d ‘{ “model”: “qwen2.5vl:7b”, “messages”: [ { “role”: “user”, “content”: “写一段代码” } ]}’

效果见下图：

五、总结

Qwen 2.5-VL 7B 简直就是“本地视觉小钢炮”。

笔者认为它尤其适合在如下场景中发挥作用：

文档和票据解析：发票、合同、报表、扫描件，一次推理即可提取文字并生成结构化数据
表格与图表解析：财务报表、统计图表，快速提取表头和数据，方便后续分析
图片场景理解：仓库、机房、办公室等照片，自动识别物体和整体场景
多模态问答：结合图片和文本内容回答问题，支持科研、教育或产品原型
内容审核与合规检测：识别敏感文字或违规图像，本地部署保护隐私

六、如何系统的学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一直在更新，更多的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

在这里插入图片描述