首页 - 个人博客

基于LMStudio本地部署DeepSeek R1系列模型：远离营销陷阱，回归技术本质

本文介绍了DeepSeek-R1开源大模型的创新之处及其在AI领域的重要意义，同时指出了当前市场上围绕该模型的一些不当行为，如过度营销、技术误导和商业套利等。文章详细分析了DeepSeek-R1系列模型的性能表现，强调小参数模型与原始模型之间的显著差距，并揭示了强行在配置不足的设备上运行大模型可能带来的硬件安全隐患、系统稳定性问题和能耗成本问题。为了帮助用户更安全、便捷地部署模型，作者推荐了LMStudio工具，并提供了详细的安装和使用指南。最后，文章呼吁回归技术本质，远离营销陷阱，强调开源精神的核心是知识共享和技术普惠，而非制造信息差和高门槛牟利。

2025-02-07

打造你的AI知识管家：基于RAG的本地知识库聊天助手实战指南

本文介绍了如何利用RAG（检索增强生成）技术构建一个本地知识库聊天助手。RAG技术通过结合大语言模型（LLM）和本地文档检索，能够生成基于最新、最相关信息的准确回答，避免了传统AI模型可能产生的“幻觉”问题。文章详细解释了RAG的工作原理，强调了本地知识库的重要性，尤其是在处理敏感数据时，能够确保数据隐私和安全。文章分为两个主要部分： 1. **RAG技术的基础**：RAG通过将用户问题与本地文档进行向量化匹配，检索相关信息并生成回答。这种方法不仅提高了回答的准确性，还能有效降低API调用成本。 2. **实现细节**：文章提供了详细的代码实现，包括文档处理、向量化存储、检索流程以及如何构建一个基于Flask的Web应用界面。通过使用M3E-Large模型进行文本向量化，并结合SQLite数据库和文件系统存储向量数据，系统能够高效地处理文档并生成准确的回答。最终，文章展示了如何将控制台应用升级为一个带有Web界面的聊天助手，用户可以通过界面与知识库进行交互，并上传新的文档以扩展知识库。

2025-01-19

从零开始：打造你的第一个AI聊天应用

本文是一篇关于如何从零开始构建一个AI聊天应用的教程。文章首先介绍了使用Python、Flask和HTML等技术栈的优势，强调其简单易学且能快速实现核心功能。接着，教程分阶段逐步实现了一个完整的AI聊天应用：从基础的单次对话到流式输出，再到支持连续对话和多轮对话系统。最后，教程展示了如何将控制台应用转换为Web应用，使用Flask搭建后端服务，并通过HTML设计前端界面，实现实时通信和流式响应。最终完成了一个功能完整、界面友好的AI聊天Web应用。

2025-01-17

科学上网环境配置攻略：写给初探AI应用与开发领域的你

这篇文章主要介绍了开发者在访问开发资源时可能遇到的网络问题，并提供了几种解决方案。首先，作者推荐了一些常用的镜像站点（如GitHub、Huggingface、Docker、npm等），帮助加速访问开发资源。接着，文章详细介绍了如何在Windows系统上使用Clash进行科学上网，包括安装、配置和选择节点等步骤。最后，作者提醒用户注意使用合规性、备份重要数据以及选择可信的镜像源和节点。文章还提供了免费节点的获取方式，帮助用户更顺畅地进行开发和学习。

2025-01-16

（大语言模型基础篇）统一API调用：让多模型调用更简单

本文介绍了如何通过统一的API调用方式简化多个大语言模型的集成过程。随着AI领域的快速发展，各大厂商推出了不同的大语言模型服务，开发者需要高效管理和使用这些API接口。文章提出以OpenAI的API格式作为统一标准，通过开源工具（如One-API和New-API）将不同平台的API格式自动转换为OpenAI格式，从而简化开发流程。文章详细演示了如何使用New-API进行部署和配置，并通过Docker和MySQL实现快速安装和长期运行。最终，开发者可以通过统一的API格式调用多个大语言模型，提升开发效率并降低维护成本。

2025-01-14

域名入坑基础

本文介绍了域名的基本概念及其重要性。域名是互联网上用于识别和定位计算机的字符标识系统，类似于“QQ名”，帮助用户避免记忆复杂的IP地址和端口号。使用域名不仅方便记忆，还能提高安全性和访问速度。文章还详细介绍了如何购买域名，推荐了Gname作为购买平台，并展示了购买流程。接着，文章介绍了如何将域名托管到Cloudflare，以提升网站的访问速度、安全性和稳定性。通过Cloudflare的免费服务，用户可以轻松管理域名解析和其他配置。