归档: 2025/7

Milvus 向量数据库实践入门

本文章分享如何在 Python 项目中使用 Milvus 向量数据库进行向量存储和检索。将以实际代码示例为基础,逐步讲解 Milvus 的基本使用,包括集合创建、数据导入、索引构建和查询。示例基于网络文章数据(original_page 表),使用 llama.cpp server 作为嵌入模型推理服务。 Milvus 简介Milvus 是一个开源的向量数据库,专为大规模向量相似性搜索而设计。它支

使用 Crawl4AI 抓取搜狐文章教程

Crawl4AI 介绍Crawl4AI 是一个开源的异步网络爬虫库,专为 AI 应用设计。它允许开发者轻松抓取网页内容、提取结构化数据,并支持自定义提取策略。Crawl4AI 内置了对 JavaScript 支持的浏览器自动化,适合处理动态网页。官方文档:https://docs.crawl4ai.com/。 Crawl4AI 的核心优势包括: 异步操作:高效处理并发请求。 提取策略:支持 CS

使用 Playwright 构建小红书笔记采集:从架构设计到实战应用

免责声明:本文内容仅用于学习和研究,不建议用于任何其它用途,作者不承担因使用本项目而导致的任何法律问题。 前言在当今信息爆炸的时代,小红书作为重要的高质量内容分享平台,蕴含着大量有价值的用户生成内容,特别是在旅游、美食、服装等垂直领域。本文将详细介绍如何使用 Playwright 构建一个高效、稳定的小红书笔记爬虫系统,涵盖架构设计、核心实现和最佳实践。 技术栈选择为什么选择 Playwright

使用 Earth2Studio 和 AI 模型进行全球天气预测:太阳辐照

使用 Earth2Studio 和 AI 模型进行全球太阳辐照预测太阳能作为一种关键的可再生能源,其稳定性和效率在很大程度上取决于对太阳辐照度的精确预测。本文将指导您如何利用 NVIDIA 的 Earth2Studio 框架,结合强大的 FourCastNet (SFNO) 天气预报模型和 SolarRadiationAFNO 诊断模型,轻松实现全球范围内的太阳辐照度(GHI)预测。 我们将通过一

类型、分类定义时使用 type 还是 kind ?

在编程设计中对 分类、类型、状态 进行设计时,很多时候选择的单词本身并不能体现现分类、类型的含义,比如:Error、Message,那这时我们就会加上 Type 后缀,对应的字段通知就会使用 type 进行命名。比如在定义消息体时: 1234pub struct MessagePayload { pub type: MessageType, pub content: String,&