Commit Graph

8 Commits

Author SHA1 Message Date
04d1106e53 修复CLI使用的是props字段,而你的脚本使用的是columns字段的问题确保正确 python 能正确加载 2025-10-23 20:49:22 +08:00
60c5ce152b feat: 添加CSV文件比较可视化功能和pixi配置更新
主要改动:
1. 新增CSV文件比较可视化功能:
   - 添加了src/visualization/comparison.py模块,支持比较两个CSV文件并使用不同颜色可视化
   - 支持命令行和API两种使用方式
   - 可生成静态图像或启动交互式查看器
   - 支持自定义标签、模型和UMAP参数

2. 更新pixi.toml配置:
   - 添加linux-64平台支持
   - 增加多个依赖项:ipykernel, anywidget, rdkit, selfies, fastapi, fastmcp, docker等
   - 完善依赖版本约束

3. 更新README.md文档:
   - 添加CSV文件比较可视化功能说明和使用示例
2025-10-23 19:27:13 +08:00
deecbfe0fc 修复create_embedding_service和visualize_csv_comparison函数中的问题
1. 修复create_embedding_service函数:
   - 添加缺失的导入语句
   - 修正metadata中neighbors列名不一致问题
   - 添加database配置确保数据能正确加载

2. 优化visualize_csv_comparison函数:
   - 调整_row_index列添加时机
   - 添加CSV文件读取错误处理
   - 添加列名验证功能
   - 保持与create_embedding_service一致的neighbors列名
2025-10-23 18:09:33 +08:00
991bcc491f 修复interactive viewer中的metadata配置和列名问题
1. 在metadata中添加database.load配置,确保前端能正确加载数据到DuckDB
2. 将neighbors列名从'neighbors'改为'__neighbors'以符合embedding-atlas标准
3. 更新launch_interactive_viewer和visualize_csv_comparison函数中的相关配置
2025-10-23 18:00:10 +08:00
bbf1746046 重构项目结构并更新README.md
1. 重构目录结构:
   - 创建src/visualization模块用于存放可视化相关功能
   - 移动script/visualize_csv_comparison.py到src/visualization/comparison.py
   - 创建src/visualization/__init__.py导出主要函数
   - 整理script目录,按功能分类存放脚本文件

2. 更新README.md:
   - 添加CSV文件比较可视化部分
   - 提供Python API和命令行使用方法说明
   - 描述功能特点和使用示例

3. 更新模块引用:
   - 修正comparison.py中的模块引用路径
   - 更新命令行帮助信息中的使用示例
2025-10-23 17:55:36 +08:00
9f0a0fbcdc update 2025-10-23 16:21:52 +08:00
5e21419a67 update 2025-09-22 20:15:54 +08:00
8b3b8508b9 first commit 2025-09-22 20:06:39 +08:00