官方项目
OpenMMLab 体系持续维护的高质量项目
MMPreTrainNEW
提供深度学习预训练模型和算法的工具箱
  • 支持多样的主干网络与预训练模型
  • 支持多种训练策略(有监督学习,无监督学习等)和技巧
  • 高效率和高可扩展性
  • 丰富的模型分析,可视化和实验的脚本
多模态图像分类自监督预训练
MMEngineNEW
一个用于深度学习模型训练的基础库
  • 高级的通用训练器
  • 接口统一的开放架构
  • 乐高式的训练流程
深度学习计算机视觉
MMagicNEW
图像&视频生成和编辑的开源开源工具箱
  • 涵盖了 GAN,diffusion model 等多种生成模型
  • 支持 stable diffusion 的微调及其激动人心的 diffusion 应用
  • 支持图像修复、图文生成、3D 生成、图像修补、抠图、超分辨率和生成等多种任务
  • 通过组合不同模块轻松构建自定义的生成模型
AIGC扩散模型
PlaygroundNEW
OpenMMLab 相关应用展示平台
  • 前沿
  • 有趣
  • 应用
Demo社区项目应用
MMCV
面向计算机视觉的基础库
  • 提供通用的 IO 接口
  • 支持图像/视频/光流的处理
  • CUDA 算子的高质量实现
  • 提供用于 PyTorch 的高层训练接口
计算机视觉
MMDetection
提供基准测试的目标检测开源工具箱
  • 模块化设计
  • 支持多种现有的框架
  • 支持高效率的模型训练
  • 性能极佳
全景分割视觉定位目标检测实例分割
MMYOLO
YOLO 系列的目标检测开源工具箱
  • 支持多种 YOLO 算法公平分析比较
  • 支持高效率的模型训练
  • 工业界部署友好
YOLO工业级目标检测
MMDetection3D
下一代通用 3D 目标检测开源工具箱
  • 支持多种现有的多模态/单模态检测器
  • 支持现有的室内/室外 3D 检测方法
  • 与 2D 检测方法能够形成自然的融合
  • 提供高效率的训练/推理过程
3D 目标检测3D 分割
MMAction2
下一代行为理解开源工具箱
  • 能够处理行为识别,定位,检测和骨骼动作识别四大类任务
  • 支持 20+ 不同数据集, 支持 20+ 种不同算法
行为识别行为定位动作检测骨骼动作识别
MMSegmentation
最全面的语义分割开源工具箱
  • 支持多样的语义分割网络方法
  • 模块化设计
  • 以更短的训练时间获得更高的模型性能
  • 为语义分割提供统一的训练/推理流程
语义分割医学图像遥感图像
MMPose
提供基准测试的姿态估计开源工具箱
  • 支持自顶向下和自底向上的范式
  • 针对人、手、脸和动物等不同对象的 2/3D 姿态估计
  • 提供多种姿态评估模型
姿态估计关键点检测
MMTracking
首个统一视频感知平台
  • 支持基于视频的目标检测任务
  • 支持单个目标的跟踪任务
  • 支持多个目标跟踪任务
视频感知
MMOCR
文本检测、文本识别和文本理解工具箱
  • 全面的训练/推理流程
  • 提供多种模型
  • 模块化设计
  • 支持多种文本相关任务
文本检测文本识别关键信息提取
MMDeploy
一个开源深度学习模型部署工具箱
  • 全面支持 OpenMMLab 模型的部署
  • 支持多种推理后端, 包括: TensorRT, OpenPPL, ONNX Runtime, ncnn, OpenVINO
  • 高度可扩展的 SDK 开发框架 (C/C++)
推理后端模型转换SDK
MMRazor
基于 Pytorch 的模型压缩工具箱
  • 可轻松应用在 OpenMMLab 的其他项目中
  • 支持多种压缩算法可以以一种即插即用的方式组合使用
  • 更好的模块化设计,一些算法通过修改配置文件即可开发完成
网络结构搜索模型剪枝知识蒸馏
MMHuman3D
人体参数化模型工具箱与测试基准
  • 使用模块化的框架复现流行的算法
  • 通过一个统一的数据规范 HumanData 支持多种数据集
  • 多功能可视化工具箱
人体姿态和形状估计人体参数化模型
MMFlow
基于 PyTorch 的光流工具箱
  • 首个光流算法的统一框架
  • 模块化设计
  • 丰富的开箱即用的算法和数据集
光流估计
MMFewShot
基于 PyTorch 的少样本学习代码库
  • 支持多种少样本任务
  • 强大的基准模型与 SOTA
  • 模块化设计
少样本学习
MMRotate
旋转框检测工具箱与测试基准
  • 旋转框检测的统一框架
  • 灵活的模块化设计
  • 强大的基准模型与 SOTA
  • 和 MMDetection 的自然集成
旋转框检测
探索性项目
探索性状态的实验项目
Multi-modal GPT
  • 支持多种视觉和语言指令数据
  • 使用 LoRA 进行参数高效微调
  • 同时微调视觉和语言部分,相互补充
多模态GPT
OpenUnReID
用于无监督或者领域自适应目标重识别的开源工具箱
  • 模块化设计
  • 支持多种伪标注和数据域转换的方法
  • 提供实施在 GPU 上的高效率训练/推理步骤
  • 提供多种易于扩展的数据集和模型
  • 在无监督学习任务和无监督域自适应任务上具有着出众的性能表现
无监督学习目标重识别
OpenPCDet
适用于基于 LiDAR 的 3D 场景感知的开源项目
  • 支持单阶段和多阶段的 3D 目标检测框架
  • 支持将堆叠版本的 set abstraction 算法用于编码不同场景下任意数量的点云
  • 支持在检测器的学习目标分配过程中使用自适应地训练样本选择 (ATSS)
  • 支持 RoI-aware 点云池化方法和 RoI-grid 点云池化方法
点云3D 场景感知
MMSkeleton
基于骨骼的人体理解开源工具箱
  • 模块化设计
  • 支持多种人体理解任务
  • 支持端到端的推理流程
  • 具有高效的训练/推理过程
人体理解
MMAction
用于人类行为理解的开源工具箱
  • 能够处理多种行人理解任务
  • 支持多种数据集
  • 支持多种行为理解框架
  • 模块化设计
  • 提供适用于视频处理的优化策略
行为理解
MMFashion
开源的视觉时尚分析工具箱
  • 易于扩展的模块化设计
  • 为非专业人员提供多种现成模型
  • 支持广泛的流行元素分析任务
流行元素分析