项目展示

FastSAM-Demo

基于 SAM 2.1(Segment Anything Model 2)的交互式图像分割 Web 应用。用户上传图片后,点击任意物体即可实时分割并高亮显示。

技术栈

  • 后端: FastAPI + SAM 2.1(Meta 分割模型,Apache 2.0 开源)
  • 前端: Next.js 15 + TypeScript + Tailwind CSS v4 + Framer Motion
  • 模型: SAM 2.1 Hiera — 支持图片/视频分割,无需申请,直接下载
  • 包管理: uv (后端) + npm (前端)

核心特性

  • 点击即分割: click-to-segment 交互,毫秒级响应
  • 多模型选择: tiny(39M) / small(46M) / base+(81M) / large(224M)
  • CPU/GPU 双模式: tiny 模型 CPU 也能跑
  • 多物体选择: 不同颜色标注多个分割区域
  • RLE 压缩传输: mask 数据压缩率 > 98%
  • 无需申请: 模型权重直接下载,Apache 2.0 许可
FastAPISAMNext.js

基于 Agentic RAG 架构的智能文档问答系统

上传 PDF,提问即可获得基于文档内容的精准回答。系统默认优先检索本地文档,文档中找不到答案时自动 fallback 到网络搜索,并具备自我纠错能力。

EmbeddingFastSupabaseRedisReactDocker

TempoFlow

一款轻量级个人助手应用,集成天气推送、备忘提醒和 AI 对话功能。采用 PWA 技术,无需应用商店,浏览器访问即可安装使用。

ReactPythonFastTypeScriptPostgreSQLRedisDocker

基于 Ultralytics YOLOv8 和 Flask Blueprints 的姿态估计的智能 Web 项目

本项目基于 Ultralytics YOLOv8Flask Blueprints 构建,提供一个智能姿态估计的 Web 应用平台,主要实现以下功能:

  • 多模块姿态估计
    支持图片、视频及实时摄像头三种输入形式的姿态估计,模块化设计,功能清晰独立。

  • 用户管理系统
    提供用户注册、登录和信息管理功能,基于 PostgreSQL 实现数据持久化存储。

  • 前后端交互
    利用 JavaScript、JQuery 等前端技术,实现图片上传、视频播放及实时摄像头数据交互。

  • 高效模型推理
    集成 YOLOv8 模型,实现对人体关键点的快速准确识别和姿态估计。

  • 完整项目架构
    涵盖数据库配置、后端API设计、前端页面开发及项目部署,构建一套可运行的智能姿态估计 Web 服务。

FlaskPostgreSQLpsycopgSeleniumPython

Label Explorer

基于 Electron 的 YOLO 标签分析与整合工具

PyPi

基于向量数据库的人脸识别注册与登录系统

本项目基于向量数据库,构建了一个人脸识别注册与登录系统,核心特点和功能如下:

  • 向量数据库支持
    利用 PostgreSQL 的 pgvector 插件实现高效的向量存储与相似度检索,提升人脸特征匹配性能。

  • 人脸识别模型集成
    集成 InsightFace 人脸识别模型,实现精准的人脸特征提取,支持多种识别距离度量(欧氏距离、余弦相似度)。

  • 多端支持
    提供 Python CLI 命令行注册和登录模块,方便快速测试与使用;
    基于 Flask 3 Blueprints 构建模块化 Web 应用,支持用户通过网页完成注册和登录。

  • 数据库管理
    使用 PostgreSQL 存储用户向量特征与相关信息,支持初始化数据库及插件激活。

  • 自动化测试
    集成 Selenium 自动化测试脚本,实现对注册和登录页面的自动化功能测试。

FlaskPythonJQuerySeleniumPostgreSQLpgvector