init

2026-03-06 20:52:16 +08:00
commit 763372851e
10 changed files with 1249 additions and 0 deletions
--- a/.env.example
+++ b/.env.example
@@ -0,0 +1,16 @@
 # ChromaDB Configuration
 CHROMA_DB_PATH=/app/chroma_db
 CHROMA_COLLECTION_NAME=memories
 # SQLite Configuration
 SQLITE_DB_PATH=/app/graph_store.db
 # Ollama Configuration
 # When using Docker Compose with Ollama service, use: http://ollama:11434
 # When running Ollama on host machine, use: http://host.docker.internal:11434
 OLLAMA_HOST=http://ollama:11434
 OLLAMA_LLM_MODEL=llama3.2
 OLLAMA_EMBEDDER_MODEL=nomic-embed-text
 # History Database Configuration
 HISTORY_DB_PATH=/app/history/history.db
--- a/27
+++ b/27
@@ -0,0 +1,27 @@
 FROM python:3.12-slim
 WORKDIR /app
 COPY requirements.txt .
 RUN pip install --no-cache-dir -r requirements.txt
 COPY . .
 # Create directories for ChromaDB, SQLite and history database
 RUN mkdir -p /app/chroma_db /app/history
 EXPOSE 8000
 ENV PYTHONUNBUFFERED=1
 # Default environment variables for ChromaDB, SQLite and Ollama
 ENV CHROMA_DB_PATH=/app/chroma_db
 ENV CHROMA_COLLECTION_NAME=memories
 ENV SQLITE_DB_PATH=/app/graph_store.db
 ENV OLLAMA_HOST=http://host.docker.internal:11434
 ENV OLLAMA_LLM_MODEL=llama3.2
 ENV OLLAMA_EMBEDDER_MODEL=nomic-embed-text
 ENV HISTORY_DB_PATH=/app/history/history.db
 CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000", "--reload"]
--- a/7
+++ b/7
@@ -0,0 +1,7 @@
 build:
 	docker build -t mem0-api-server .
 run_local:
 	docker run -p 8000:8000 -v $(shell pwd):/app mem0-api-server --env-file .env
 .PHONY: build run_local
--- a/OLLAMA_DOCKER.md
+++ b/OLLAMA_DOCKER.md
@@ -0,0 +1,493 @@
 # Ollama Docker Compose 部署指南
 ## 📋 概述
 现在 Mem0 Server 的 docker-compose.yaml 已经包含了 Ollama 服务，所有组件都可以通过 Docker Compose 统一管理。
 ---
 ## 🏗️ 新架构
 ### 技术架构
 ```
 ┌─────────────┐
 │   Mem0 App  │ (FastAPI, port: 8888)
 └──────┬──────┘
       │
       ├──→ ┌─────────────┐
       │    │   Ollama    │ (port: 11434)
       │    │  LLM+AI     │
       │    └─────────────┘
       │
       ├──→ ┌─────────────┐
       │    │  ChromaDB   │ (Embedded)
       │    └─────────────┘
       │
       └──→ ┌─────────────┐
            │   SQLite    │ (Embedded)
            └─────────────┘
 ```
 ### 服务列表
 - `mem0` - FastAPI 应用（端口 8888）
 - `ollama` - Ollama AI 服务（端口 11434）
 ---
 ## 🚀 快速开始
 ### 方式 1：使用 GPU（推荐）
 如果您的机器有 NVIDIA GPU：
 ```bash
 # 启动所有服务
 docker-compose --profile gpu up -d
 # 查看状态
 docker-compose ps
 # 查看日志
 docker-compose logs -f ollama
 ```
 ### 方式 2：仅使用 CPU
 如果没有 GPU：
 ```bash
 # 启动所有服务（不使用 GPU profile）
 docker-compose up -d
 # 注意：Ollama 在 CPU 模式下可能较慢
 ```
 ---
 ## 📊 docker-compose.yaml 配置说明
 ### Ollama 服务配置
 ```yaml
 ollama:
  image: ollama/ollama:latest
  container_name: ollama
  restart: on-failure
  networks:
    - mem0_network
  healthcheck:
    test: ["CMD", "curl", "-f", "http://localhost:11434/api/tags"]
    interval: 5s
    timeout: 5s
    retries: 10
    start_period: 60s  # 给 Ollama 60 秒启动时间
  volumes:
    - ollama_data:/root/.ollama  # 持久化模型数据
  ports:
    - "11434:11434"  # 暴露 Ollama API
  profiles: ["gpu"]  # GPU 配置
  deploy:
    resources:
      reservations:
        devices:
          - driver: nvidia
            count: all
            capabilities: [gpu]
 ```
 ### Mem0 服务配置更新
 ```yaml
 mem0:
  environment:
    - OLLAMA_HOST=http://ollama:11434  # 使用 Docker 网络访问 Ollama
    - OLLAMA_LLM_MODEL=llama3.2
    - OLLAMA_EMBEDDER_MODEL=nomic-embed-text
  depends_on:
    ollama:
      condition: service_healthy  # 等待 Ollama 健康检查通过
 ```
 ---
 ## 🔧 使用步骤
 ### 1. 首次启动
 ```bash
 # 启动服务
 docker-compose --profile gpu up -d
 # 等待 Ollama 启动完成（约 60 秒）
 docker-compose logs -f ollama
 # 查看已加载的模型
 docker exec ollama ollama list
 ```
 ### 2. 下载模型
 首次使用需要下载模型：
 ```bash
 # 进入 Ollama 容器
 docker exec -it ollama bash
 # 下载 LLM 模型
 ollama pull llama3.2
 # 下载嵌入模型
 ollama pull nomic-embed-text
 # 退出
 exit
 ```
 或者一次性下载：
 ```bash
 docker exec ollama ollama pull llama3.2
 docker exec ollama ollama pull nomic-embed-text
 ```
 ### 3. 测试 Ollama
 ```bash
 # 测试 Ollama API
 curl http://localhost:11434/api/tags
 # 测试生成
 curl http://localhost:11434/api/generate -d '{
  "model": "llama3.2",
  "prompt": "Hello, how are you?"
 }'
 ```
 ### 4. 测试 Mem0 API
 ```bash
 # 访问 API 文档
 http://localhost:8888/docs
 # 创建记忆
 curl -X POST http://localhost:8888/memories \
  -H "Content-Type: application/json" \
  -d '{
    "messages": [
      {"role": "user", "content": "你好"},
      {"role": "assistant", "content": "你好！有什么可以帮助你的？"}
    ],
    "user_id": "test_user"
  }'
 ```
 ---
 ## 💾 数据持久化
 ### Ollama 数据卷
 - **名称**: `ollama_data`
 - **路径**: `/root/.ollama`
 - **内容**: 下载的模型文件、配置等
 ### 查看数据卷
 ```bash
 # 查看数据卷信息
 docker volume inspect ollama_data
 # 查看数据卷位置
 docker volume ls | grep ollama_data
 ```
 ---
 ## ⚙️ 配置选项
 ### 使用不同的模型
 编辑 `.env` 文件：
 ```bash
 OLLAMA_LLM_MODEL=mistral
 OLLAMA_EMBEDDER_MODEL=mxbai-embed-large
 ```
 重启服务：
 ```bash
 docker-compose --profile gpu up -d
 ```
 ### 调整 Ollama 资源
 如果需要更多 GPU 资源：
 ```yaml
 deploy:
  resources:
    reservations:
      devices:
        - driver: nvidia
          device_ids: ['0', '1']  # 使用特定 GPU
          capabilities: [gpu]
 ```
 ---
 ## 🔍 故障排查
 ### Ollama 启动失败
 ```bash
 # 查看详细日志
 docker-compose logs ollama
 # 检查健康状态
 docker-compose ps ollama
 # 进入容器调试
 docker exec -it ollama bash
 ```
 ### 模型下载慢
 ```bash
 # 设置国内镜像（如果可用）
 export OLLAMA_MODELS=https://mirror.ghproxy.com/https://github.com/ollama/ollama/releases/download
 # 或者手动下载模型文件后挂载
 ```
 ### GPU 不可用
 ```bash
 # 检查 NVIDIA Docker 是否安装
 nvidia-smi
 # 检查容器是否识别 GPU
 docker exec ollama nvidia-smi
 # 如果没有 GPU，使用 CPU 模式
 docker-compose up -d
 ```
 ### Mem0 无法连接 Ollama
 ```bash
 # 检查网络连通性
 docker exec mem0 ping ollama
 # 检查 Ollama 是否运行
 docker exec mem0 curl http://ollama:11434/api/tags
 # 查看依赖关系
 docker-compose ps
 ```
 ---
 ## 🎯 优势特点
 ### 统一管理
 - ✅ 所有服务通过 docker-compose 管理
 - ✅ 一键启动/停止
 - ✅ 自动处理依赖关系
 ### 数据隔离
 - ✅ Ollama 数据独立存储
 - ✅ 不会污染宿主机环境
 - ✅ 易于备份和迁移
 ### 网络自动化
 - ✅ Docker 网络自动配置
 - ✅ 服务间通过服务名通信
 - ✅ 无需手动配置 IP
 ### 健康检查
 - ✅ 自动检测 Ollama 状态
 - ✅ Mem0 等待 Ollama 就绪
 - ✅ 提高系统可靠性
 ---
 ## 📈 性能优化
 ### GPU 加速
 ```yaml
 # 启用 GPU 支持
 profiles: ["gpu"]
 deploy:
  resources:
    reservations:
      devices:
        - driver: nvidia
          count: all
          capabilities: [gpu]
 ```
 ### 内存优化
 ```yaml
 # 限制最大内存使用
 deploy:
  resources:
    limits:
      memory: 8G
    reservations:
      memory: 4G
 ```
 ### 并发优化
 ```bash
 # 设置 Ollama 并发数
 docker exec ollama sh -c 'echo "OLLAMA_NUM_PARALLEL=4" >> /root/.ollama/config.json'
 ```
 ---
 ## 🔄 常用命令
 ### 启动服务
 ```bash
 # 带 GPU 支持
 docker-compose --profile gpu up -d
 # 仅 CPU
 docker-compose up -d
 ```
 ### 停止服务
 ```bash
 docker-compose --profile gpu down
 ```
 ### 查看状态
 ```bash
 # 查看所有服务
 docker-compose ps
 # 查看 Ollama 日志
 docker-compose logs -f ollama
 # 查看 Mem0 日志
 docker-compose logs -f mem0
 ```
 ### 重启服务
 ```bash
 # 重启 Ollama
 docker-compose restart ollama
 # 重启 Mem0
 docker-compose restart mem0
 # 重启所有
 docker-compose restart
 ```
 ### 进入容器
 ```bash
 # 进入 Ollama 容器
 docker exec -it ollama bash
 # 进入 Mem0 容器
 docker exec -it mem0 bash
 ```
 ### 管理模型
 ```bash
 # 列出已安装的模型
 docker exec ollama ollama list
 # 下载新模型
 docker exec ollama ollama pull mistral
 # 删除模型
 docker exec ollama ollama rm llama3.2
 # 查看模型信息
 docker exec ollama ollama show llama3.2
 ```
 ---
 ## 💡 最佳实践
 ### 1. 首次部署
 ```bash
 # 1. 启动服务
 docker-compose --profile gpu up -d
 # 2. 等待 Ollama 就绪
 sleep 60
 # 3. 下载所需模型
 docker exec ollama ollama pull llama3.2
 docker exec ollama ollama pull nomic-embed-text
 # 4. 测试 API
 curl http://localhost:8888/docs
 ```
 ### 2. 日常使用
 ```bash
 # 启动
 docker-compose --profile gpu up -d
 # 停止
 docker-compose --profile gpu down
 # 重启
 docker-compose --profile gpu restart
 ```
 ### 3. 数据备份
 ```bash
 # 备份 Ollama 数据
 docker run --rm \
  -v ollama_data:/data \
  -v $(pwd):/backup \
  alpine tar czf /backup/ollama_backup.tar.gz /data
 ```
 ### 4. 恢复数据
 ```bash
 # 恢复 Ollama 数据
 docker run --rm \
  -v ollama_data:/data \
  -v $(pwd):/backup \
  alpine tar xzf /backup/ollama_backup.tar.gz -C /
 ```
 ---
 ## 🆘 常见问题
 ### Q1: Ollama 启动很慢？
 **A:** Ollama 首次启动需要加载模型，可能需要 60 秒。健康检查配置了 `start_period: 60s` 来等待。
 ### Q2: 如何切换模型？
 **A:** 修改 `.env` 中的 `OLLAMA_LLM_MODEL`，然后重启服务，并确保新模型已下载。
 ### Q3: GPU 内存不足？
 **A:** 使用更小的模型（如 `phi3`），或限制并发数。
 ### Q4: 如何完全清理？
 **A:** 
 ```bash
 docker-compose --profile gpu down -v  # 删除所有数据卷
 ```
 ### Q5: 可以在没有 GPU 的情况下运行吗？
 **A:** 可以，但速度较慢。使用 `docker-compose up -d`（不带 gpu profile）。
 ---
 ## 📚 相关文档
 - [README.md](./README.md) - 项目主文档
 - [TECH_STACK.md](./TECH_STACK.md) - 技术架构说明
 - [QUICK_START.md](./QUICK_START.md) - 快速入门
 - [DEPLOYMENT.md](./DEPLOYMENT.md) - 详细部署指南
 ---
 现在所有服务都集成在 docker-compose.yaml 中，管理更加简单统一！🎉
--- a/README.md
+++ b/README.md
@@ -0,0 +1,105 @@
 # Mem0 REST API Server
 Mem0 provides a REST API server (written using FastAPI). Users can perform all operations through REST endpoints. The API also includes OpenAPI documentation, accessible at `/docs` when the server is running.
 ## Features
 - **Create memories:** Create memories based on messages for a user, agent, or run.
 - **Retrieve memories:** Get all memories for a given user, agent, or run.
 - **Search memories:** Search stored memories based on a query.
 - **Update memories:** Update an existing memory.
 - **Delete memories:** Delete a specific memory or all memories for a user, agent, or run.
 - **Reset memories:** Reset all memories for a user, agent, or run.
 - **OpenAPI Documentation:** Accessible via `/docs` endpoint.
 ## Technology Stack
 - **Vector Store**: ChromaDB - 高性能向量数据库
 - **Graph Store**: SQLite - 轻量级图存储
 - **LLM & Embedder**: Ollama - 本地大模型服务
 ## Quick Start
 ### 方式 1: Docker Compose（最简单）
 ```bash
 # 1. 复制环境变量配置
 cp .env.example .env
 # 2. 编辑 .env 文件，根据需要修改配置
 # vi .env 或 nano .env
 # 3. 启动所有服务（包括 Ollama）
 docker-compose --profile gpu up -d
 # 4. 访问 API 文档
 open http://localhost:8888/docs
 ```
 **注意**: 首次启动需要下载 Ollama 模型，请等待约 60 秒。
 ### 方式 2: Docker 命令部署
 ```bash
 # 1. 构建镜像
 docker build -t mem0-server .
 # 2. 运行容器（通过环境变量传入配置）
 docker run -d \
  --name mem0-server \
  -p 8000:8000 \
  -v chroma_data:/app/chroma_db \
  -v sqlite_data:/app/graph_store.db \
  -v history_data:/app/history \
  --add-host=host.docker.internal:host-gateway \
  -e CHROMA_DB_PATH=/app/chroma_db \
  -e CHROMA_COLLECTION_NAME=memories \
  -e SQLITE_DB_PATH=/app/graph_store.db \
  -e OLLAMA_HOST=http://host.docker.internal:11434 \
  -e OLLAMA_LLM_MODEL=llama3.2 \
  -e OLLAMA_EMBEDDER_MODEL=nomic-embed-text \
  -e REDIS_HOST=host.docker.internal \
  -e REDIS_PORT=6379 \
  mem0-server
 ```
 ## 环境变量配置
 所有配置都可以通过环境变量传入：
 | 变量名 | 说明 | 默认值 |
 |--------|------|--------|
 | `CHROMA_DB_PATH` | ChromaDB 数据路径 | `/app/chroma_db` |
 | `CHROMA_COLLECTION_NAME` | ChromaDB 集合名称 | `memories` |
 | `SQLITE_DB_PATH` | SQLite 数据库路径 | `/app/graph_store.db` |
 | `OLLAMA_HOST` | Ollama 服务地址 | `http://localhost:11434` |
 | `OLLAMA_LLM_MODEL` | LLM 模型名称 | `llama3.2` |
 | `OLLAMA_EMBEDDER_MODEL` | Embedder 模型名称 | `nomic-embed-text` |
 | `HISTORY_DB_PATH` | 历史数据库路径 | `/app/history/history.db` |
 详细部署文档请查看 [DEPLOYMENT.md](./DEPLOYMENT.md)
 ## Prerequisites
 Before running the server, ensure you have:
 1. **Ollama installed and running** on your host machine
   ```bash
   # Install Ollama from https://ollama.ai
   ollama pull llama3.2
   ollama pull nomic-embed-text
   ```
 2. **Docker and Docker Compose** installed
 ## API Endpoints
 - `POST /memories` - Create new memories
 - `GET /memories` - Retrieve all memories
 - `GET /memories/{memory_id}` - Get a specific memory
 - `POST /search` - Search memories
 - `PUT /memories/{memory_id}` - Update a memory
 - `DELETE /memories/{memory_id}` - Delete a memory
 - `DELETE /memories` - Delete all memories for an identifier
 - `POST /reset` - Reset all memories
 - `GET /docs` - OpenAPI documentation
--- a/TECH_STACK.md
+++ b/TECH_STACK.md
@@ -0,0 +1,284 @@
 # Mem0 Server 技术架构
 ## 📋 技术栈
 Mem0 Server 采用简洁高效的技术架构，所有组件均通过环境变量配置。
 ### 核心组件
 | 组件 | 技术 | 用途 | 存储方式 |
 |------|------|------|----------|
 | **Vector Store** | ChromaDB | 向量存储，用于语义搜索 | 文件系统 |
 | **Graph Store** | SQLite | 图存储，管理实体关系 | 文件系统 |
 | **LLM** | Ollama | 大语言模型，文本生成 | 外部服务 |
 | **Embedder** | Ollama | 嵌入模型，向量化文本 | 外部服务 |
 ---
 ## 🏗️ 架构图
 ```
 ┌─────────────┐
 │   Mem0 App  │ (FastAPI, port: 8888)
 │  main.py    │
 └──────┬──────┘
       │
       ├──→ ┌─────────────┐
       │    │  ChromaDB   │ (Embedded)
       │    │  Vectors    │
       │    └─────────────┘
       │
       ├──→ ┌─────────────┐
       │    │   SQLite    │ (Embedded)
       │    │   Graph     │
       │    └─────────────┘
       │
       └──→ ┌─────────────┐
            │   Ollama    │ (External Service)
            │  LLM + AI   │
            └─────────────┘
 ```
 ---
 ## 🔧 技术选型理由
 ### ChromaDB（向量存储）
 - ✅ **轻量级**：无需独立数据库服务
 - ✅ **易部署**：嵌入式设计，开箱即用
 - ✅ **高性能**：专为向量相似度搜索优化
 - ✅ **持久化**：数据直接存储到文件系统
 ### SQLite（图存储）
 - ✅ **零配置**：无需安装和配置
 - ✅ **单文件**：数据存储在单个文件中
 - ✅ **成熟稳定**：经过广泛验证的数据库
 - ✅ **事务支持**：ACID 事务保证数据一致性
 ### Ollama（AI 服务）
 - ✅ **本地运行**：数据隐私和安全
 - ✅ **模型丰富**：支持多种开源模型
 - ✅ **易于使用**：简单的 API 接口
 - ✅ **性能优秀**：优化的推理引擎
 ---
 ## 📊 环境变量配置
 所有配置通过环境变量传入，实现配置与代码分离。
 ### 必需的环境变量
 ```bash
 # ChromaDB 配置
 CHROMA_DB_PATH=/app/chroma_db
 CHROMA_COLLECTION_NAME=memories
 # SQLite 配置
 SQLITE_DB_PATH=/app/graph_store.db
 # Ollama 配置
 OLLAMA_HOST=http://host.docker.internal:11434
 OLLAMA_LLM_MODEL=llama3.2
 OLLAMA_EMBEDDER_MODEL=nomic-embed-text
 # 历史数据库配置
 HISTORY_DB_PATH=/app/history/history.db
 ```
 ### 环境变量说明
 | 变量名 | 说明 | 默认值 | 示例 |
 |--------|------|--------|------|
 | `CHROMA_DB_PATH` | ChromaDB 数据存储路径 | `/app/chroma_db` | `/data/chroma` |
 | `CHROMA_COLLECTION_NAME` | ChromaDB 集合名称 | `memories` | `my_memories` |
 | `SQLITE_DB_PATH` | SQLite 数据库路径 | `/app/graph_store.db` | `/data/graph.db` |
 | `OLLAMA_HOST` | Ollama 服务地址 | `http://localhost:11434` | `http://ollama:11434` |
 | `OLLAMA_LLM_MODEL` | LLM 模型名称 | `llama3.2` | `mistral`, `llama3.1` |
 | `OLLAMA_EMBEDDER_MODEL` | Embedder 模型名称 | `nomic-embed-text` | `mxbai-embed-large` |
 | `HISTORY_DB_PATH` | 历史数据库路径 | `/app/history/history.db` | `/data/history.db` |
 ---
 ## 🚀 部署方式
 ### Docker Compose（推荐）
 ```yaml
 services:
  mem0:
    build: .
    ports:
      - "8888:8000"
    volumes:
      - ./chroma_db:/app/chroma_db
      - ./history:/app/history
    environment:
      - CHROMA_DB_PATH=/app/chroma_db
      - CHROMA_COLLECTION_NAME=memories
      - SQLITE_DB_PATH=/app/graph_store.db
      - OLLAMA_HOST=http://host.docker.internal:11434
      - OLLAMA_LLM_MODEL=llama3.2
      - OLLAMA_EMBEDDER_MODEL=nomic-embed-text
 ```
 启动命令：
 ```bash
 docker-compose up -d
 ```
 ### Docker 命令
 ```bash
 docker run -d \
  --name mem0-server \
  -p 8888:8000 \
  -v $(pwd)/chroma_db:/app/chroma_db \
  -v $(pwd)/history:/app/history \
  -e CHROMA_DB_PATH=/app/chroma_db \
  -e CHROMA_COLLECTION_NAME=memories \
  -e SQLITE_DB_PATH=/app/graph_store.db \
  -e OLLAMA_HOST=http://host.docker.internal:11434 \
  -e OLLAMA_LLM_MODEL=llama3.2 \
  -e OLLAMA_EMBEDDER_MODEL=nomic-embed-text \
  mem0-server
 ```
 ---
 ## 💾 数据持久化
 ### ChromaDB 数据
 - **位置**：`./chroma_db/`
 - **内容**：向量数据、集合元数据
 - **格式**：ChromaDB 内部格式
 ### SQLite 数据
 - **位置**：`./graph_store.db`（或自定义路径）
 - **内容**：图结构数据、实体关系
 - **格式**：SQLite 数据库文件
 ### 历史数据
 - **位置**：`./history/history.db`
 - **内容**：记忆变更历史记录
 - **格式**：SQLite 数据库文件
 ---
 ## 🔍 工作流程
 ### 1. 创建记忆
 ```
 用户消息 → FastAPI → Memory.add()
    ↓
 Ollama Embedder → 生成向量
    ↓
 ChromaDB → 存储向量
    ↓
 SQLite → 存储实体关系
    ↓
 返回结果
 ```
 ### 2. 搜索记忆
 ```
 搜索查询 → FastAPI → Memory.search()
    ↓
 Ollama Embedder → 查询向量化
    ↓
 ChromaDB → 向量相似度搜索
    ↓
 返回匹配的记忆
 ```
 ### 3. 获取记忆
 ```
 用户 ID → FastAPI → Memory.get_all()
    ↓
 SQLite → 查询图关系
    ↓
 ChromaDB → 获取相关向量
    ↓
 返回结构化记忆
 ```
 ---
 ## 🎯 优势特点
 ### 简洁性
 - ✅ 无外部数据库依赖
 - ✅ 配置文件少
 - ✅ 易于理解和维护
 ### 灵活性
 - ✅ 所有配置通过环境变量
 - ✅ 支持自定义模型
 - ✅ 可切换不同组件
 ### 可扩展性
 - ✅ ChromaDB 支持集群部署
 - ✅ SQLite 可替换为 PostgreSQL
 - ✅ Ollama 可替换为其他 LLM 服务
 ### 数据隐私
 - ✅ 本地运行 AI 模型
 - ✅ 数据不上传第三方
 - ✅ 完全可控的数据流
 ---
 ## 📈 性能特性
 ### ChromaDB
 - 毫秒级向量相似度搜索
 - 支持百万级向量规模
 - 内存映射加速查询
 ### SQLite
 - 微秒级简单查询
 - 事务安全保证
 - 自动索引优化
 ### Ollama
 - GPU 加速推理（如可用）
 - 批量处理优化
 - 模型缓存机制
 ---
 ## 🛠️ 开发建议
 ### 本地开发
 ```bash
 # 使用开发模式运行
 docker-compose -f docker-compose.yaml up --build
 # 查看日志
 docker-compose logs -f mem0
 ```
 ### 生产部署
 - 使用固定版本镜像
 - 配置数据卷备份
 - 监控资源使用
 - 设置健康检查
 ### 性能优化
 - 调整 ChromaDB 批次大小
 - 优化 SQLite 索引
 - 使用更快的存储介质（SSD）
 - 增加 Ollama 并发配置
 ---
 ## 📚 相关文档
 - [README.md](./README.md) - 项目主文档
 - [DEPLOYMENT.md](./DEPLOYMENT.md) - 详细部署指南
 - [QUICK_START.md](./QUICK_START.md) - 快速入门
 - [ENV_VARIABLES.md](./ENV_VARIABLES.md) - 环境变量详解
 ---
 这个简洁的技术架构专注于核心功能，避免了不必要的复杂性，同时保持了强大的扩展能力！🎉
--- a/dev.Dockerfile
+++ b/dev.Dockerfile
@@ -0,0 +1,25 @@
 FROM python:3.12
 WORKDIR /app
 # Install Poetry
 RUN curl -sSL https://install.python-poetry.org | python3 -
 ENV PATH="/root/.local/bin:$PATH"
 # Copy requirements first for better caching
 COPY server/requirements.txt .
 RUN pip install -r requirements.txt
 # Install mem0 in editable mode using Poetry
 WORKDIR /app/packages
 COPY pyproject.toml .
 COPY poetry.lock .
 COPY README.md .
 COPY mem0 ./mem0
 RUN pip install -e .[graph]
 # Return to app directory and copy server code
 WORKDIR /app
 COPY server .
 CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000", "--reload"]
--- a/docker-compose.yaml
+++ b/docker-compose.yaml
@@ -0,0 +1,57 @@
 name: mem0-dev
 services:
  mem0:
    build:
      context: ..  # Set context to parent directory
      dockerfile: server/dev.Dockerfile
    ports:
      - "8888:8000"
    env_file:
      - .env
    networks:
      - mem0_network
    volumes:
      - ./chroma_db:/app/chroma_db  # ChromaDB storage
      - ./history:/app/history      # History db location
      - .:/app                      # Server code. This allows to reload the app when the server code is updated
      - ../mem0:/app/packages/mem0  # Mem0 library. This allows to reload the app when the library code is updated
    command: uvicorn main:app --host 0.0.0.0 --port 8000 --reload  # Enable auto-reload
    environment:
      - PYTHONDONTWRITEBYTECODE=1  # Prevents Python from writing .pyc files
      - PYTHONUNBUFFERED=1  # Ensures Python output is sent straight to terminal
      - CHROMA_DB_PATH=/app/chroma_db
      - CHROMA_COLLECTION_NAME=memories
      - SQLITE_DB_PATH=/app/graph_store.db
      - OLLAMA_HOST=http://ollama:11434
      - OLLAMA_LLM_MODEL=llama3.2
      - OLLAMA_EMBEDDER_MODEL=nomic-embed-text
      - HISTORY_DB_PATH=/app/history/history.db
    depends_on:
      ollama:
        condition: service_healthy
  ollama:
    image: ollama/ollama:latest
    container_name: ollama
    restart: on-failure
    networks:
      - mem0_network
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:11434/api/tags"]
      interval: 5s
      timeout: 5s
      retries: 10
      start_period: 60s
    volumes:
      - ollama_data:/root/.ollama
    ports:
      - "11434:11434"
    profiles: ["gpu"]
 volumes:
  ollama_data: {}
 networks:
  mem0_network:
    driver: bridge
--- a/main.py
+++ b/main.py
@@ -0,0 +1,229 @@
 import logging
 import os
 from typing import Any, Dict, List, Optional
 from dotenv import load_dotenv
 from fastapi import FastAPI, HTTPException
 from fastapi.responses import JSONResponse, RedirectResponse
 from pydantic import BaseModel, Field
 from mem0 import Memory
 logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
 # Load environment variables
 load_dotenv()
 # ChromaDB configuration
 CHROMA_DB_PATH = os.environ.get("CHROMA_DB_PATH", "/app/chroma_db")
 CHROMA_COLLECTION_NAME = os.environ.get("CHROMA_COLLECTION_NAME", "memories")
 # SQLite configuration for graph store
 SQLITE_DB_PATH = os.environ.get("SQLITE_DB_PATH", "/app/graph_store.db")
 # Ollama configuration
 OLLAMA_HOST = os.environ.get("OLLAMA_HOST", "http://localhost:11434")
 OLLAMA_LLM_MODEL = os.environ.get("OLLAMA_LLM_MODEL", "llama3.2")
 OLLAMA_EMBEDDER_MODEL = os.environ.get("OLLAMA_EMBEDDER_MODEL", "nomic-embed-text")
 HISTORY_DB_PATH = os.environ.get("HISTORY_DB_PATH", "/app/history/history.db")
 DEFAULT_CONFIG = {
    "version": "v1.1",
    "vector_store": {
        "provider": "chroma",
        "config": {
            "path": CHROMA_DB_PATH,
            "collection_name": CHROMA_COLLECTION_NAME,
        },
    },
    "graph_store": {
        "provider": "sqlite",
        "config": {"db_path": SQLITE_DB_PATH},
    },
    "llm": {
        "provider": "ollama",
        "config": {
            "host": OLLAMA_HOST,
            "model": OLLAMA_LLM_MODEL,
            "temperature": 0.2,
        },
    },
    "embedder": {
        "provider": "ollama",
        "config": {
            "host": OLLAMA_HOST,
            "model": OLLAMA_EMBEDDER_MODEL,
        },
    },
    "history_db_path": HISTORY_DB_PATH,
 }
 MEMORY_INSTANCE = Memory.from_config(DEFAULT_CONFIG)
 app = FastAPI(
    title="Mem0 REST APIs",
    description="A REST API for managing and searching memories for your AI Agents and Apps.",
    version="1.0.0",
 )
 class Message(BaseModel):
    role: str = Field(..., description="Role of the message (user or assistant).")
    content: str = Field(..., description="Message content.")
 class MemoryCreate(BaseModel):
    messages: List[Message] = Field(..., description="List of messages to store.")
    user_id: Optional[str] = None
    agent_id: Optional[str] = None
    run_id: Optional[str] = None
    metadata: Optional[Dict[str, Any]] = None
 class SearchRequest(BaseModel):
    query: str = Field(..., description="Search query.")
    user_id: Optional[str] = None
    run_id: Optional[str] = None
    agent_id: Optional[str] = None
    filters: Optional[Dict[str, Any]] = None
@app.post("/configure", summary="Configure Mem0")
 def set_config(config: Dict[str, Any]):
    """Set memory configuration."""
    global MEMORY_INSTANCE
    MEMORY_INSTANCE = Memory.from_config(config)
    return {"message": "Configuration set successfully"}
@app.post("/memories", summary="Create memories")
 def add_memory(memory_create: MemoryCreate):
    """Store new memories."""
    if not any([memory_create.user_id, memory_create.agent_id, memory_create.run_id]):
        raise HTTPException(status_code=400, detail="At least one identifier (user_id, agent_id, run_id) is required.")
    params = {k: v for k, v in memory_create.model_dump().items() if v is not None and k != "messages"}
    try:
        response = MEMORY_INSTANCE.add(messages=[m.model_dump() for m in memory_create.messages], **params)
        return JSONResponse(content=response)
    except Exception as e:
        logging.exception("Error in add_memory:")  # This will log the full traceback
        raise HTTPException(status_code=500, detail=str(e))
@app.get("/memories", summary="Get memories")
 def get_all_memories(
    user_id: Optional[str] = None,
    run_id: Optional[str] = None,
    agent_id: Optional[str] = None,
 ):
    """Retrieve stored memories."""
    if not any([user_id, run_id, agent_id]):
        raise HTTPException(status_code=400, detail="At least one identifier is required.")
    try:
        params = {
            k: v for k, v in {"user_id": user_id, "run_id": run_id, "agent_id": agent_id}.items() if v is not None
        }
        return MEMORY_INSTANCE.get_all(**params)
    except Exception as e:
        logging.exception("Error in get_all_memories:")
        raise HTTPException(status_code=500, detail=str(e))
@app.get("/memories/{memory_id}", summary="Get a memory")
 def get_memory(memory_id: str):
    """Retrieve a specific memory by ID."""
    try:
        return MEMORY_INSTANCE.get(memory_id)
    except Exception as e:
        logging.exception("Error in get_memory:")
        raise HTTPException(status_code=500, detail=str(e))
@app.post("/search", summary="Search memories")
 def search_memories(search_req: SearchRequest):
    """Search for memories based on a query."""
    try:
        params = {k: v for k, v in search_req.model_dump().items() if v is not None and k != "query"}
        return MEMORY_INSTANCE.search(query=search_req.query, **params)
    except Exception as e:
        logging.exception("Error in search_memories:")
        raise HTTPException(status_code=500, detail=str(e))
@app.put("/memories/{memory_id}", summary="Update a memory")
 def update_memory(memory_id: str, updated_memory: Dict[str, Any]):
    """Update an existing memory with new content.
    Args:
        memory_id (str): ID of the memory to update
        updated_memory (str): New content to update the memory with
    Returns:
        dict: Success message indicating the memory was updated
    """
    try:
        return MEMORY_INSTANCE.update(memory_id=memory_id, data=updated_memory)
    except Exception as e:
        logging.exception("Error in update_memory:")
        raise HTTPException(status_code=500, detail=str(e))
@app.get("/memories/{memory_id}/history", summary="Get memory history")
 def memory_history(memory_id: str):
    """Retrieve memory history."""
    try:
        return MEMORY_INSTANCE.history(memory_id=memory_id)
    except Exception as e:
        logging.exception("Error in memory_history:")
        raise HTTPException(status_code=500, detail=str(e))
@app.delete("/memories/{memory_id}", summary="Delete a memory")
 def delete_memory(memory_id: str):
    """Delete a specific memory by ID."""
    try:
        MEMORY_INSTANCE.delete(memory_id=memory_id)
        return {"message": "Memory deleted successfully"}
    except Exception as e:
        logging.exception("Error in delete_memory:")
        raise HTTPException(status_code=500, detail=str(e))
@app.delete("/memories", summary="Delete all memories")
 def delete_all_memories(
    user_id: Optional[str] = None,
    run_id: Optional[str] = None,
    agent_id: Optional[str] = None,
 ):
    """Delete all memories for a given identifier."""
    if not any([user_id, run_id, agent_id]):
        raise HTTPException(status_code=400, detail="At least one identifier is required.")
    try:
        params = {
            k: v for k, v in {"user_id": user_id, "run_id": run_id, "agent_id": agent_id}.items() if v is not None
        }
        MEMORY_INSTANCE.delete_all(**params)
        return {"message": "All relevant memories deleted"}
    except Exception as e:
        logging.exception("Error in delete_all_memories:")
        raise HTTPException(status_code=500, detail=str(e))
@app.post("/reset", summary="Reset all memories")
 def reset_memory():
    """Completely reset stored memories."""
    try:
        MEMORY_INSTANCE.reset()
        return {"message": "All memories reset"}
    except Exception as e:
        logging.exception("Error in reset_memory:")
        raise HTTPException(status_code=500, detail=str(e))
@app.get("/", summary="Redirect to the OpenAPI documentation", include_in_schema=False)
 def home():
    """Redirect to the OpenAPI documentation."""
    return RedirectResponse(url="/docs")
--- a/requirements.txt
+++ b/requirements.txt
@@ -0,0 +1,6 @@
 fastapi==0.115.8
 uvicorn==0.34.0
 pydantic==2.10.4
 mem0ai>=0.1.48
 python-dotenv==1.0.1
 chromadb>=0.4.22