AI时代人工智能科研必备论文写作资源平台

Vibe Coding 大模型智能编程教程

大模型驱动智能编程、AI Agent、代码优化、项目级代码生成全流程教程

大模型驱动的智能编程基础 —— 从Copilot到思维链提示工程

大模型驱动智能编程、基础提示工程

打开教程 →

基于大模型智能体的智能化代码生成 —— AI Agent与MCP协议

AI Agent与MCP协议、智能体代码生成

打开教程 →

大模型驱动的代码优化与安全 —— 重构、文档生成与漏洞修复实践

代码重构、文档生成与漏洞修复

打开教程 →

大模型驱动的项目级代码生成实战

项目级代码生成全流程实战

打开教程 →

CCF Figure 科研绘图工具

开源仓库地址

https://github.com/Deepshare-Official/CCF-Figure

工具介绍

CCF Figure 是一个专门为 AI / 计算机科学领域的研究人员设计，帮助你将论文内容转化为顶会顶刊级科研配图的工具。

自动分类：识别 7 种论文类型（方法 / 机制 / 评测 / 规律 / 机器人 / 交叉 / 综述）
结构自选：从 11 种图示结构中自动匹配最优布局
完整提示词：内置中英文双语提示词模板，可直接复制使用
五大翻车预防：内置 Self-Check 清单，避免 AI 绘图的常见错误
迭代协议：标准化修改流程，最多 3 轮迭代

安装教程（Claude Code / Codex 双平台）

Claude Code - 方式一（推荐）

git clone https://github.com/Deepshare-Official/CCF-Figure ~/.claude/skills/ccf-figure

Claude Code - 方式二

git clone https://github.com/Deepshare-Official/CCF-Figure .claude/skills/ccf-figure

Codex - 方式一（推荐）

git clone https://github.com/Deepshare-Official/CCF-Figure ~/.agents/skills/ccf-figure

Codex - 方式二

git clone https://github.com/Deepshare-Official/CCF-Figure .agents/skills/ccf-figure

使用指令模板

安装完成后，在 Claude Code 或 Codex 中直接说：
帮我为这篇论文生成科研配图：
[发送你的论文原文，或粘贴论文标题 + 摘要 + 方法部分]

项目文件结构

CCF-Figure/
├── SKILL.md                   ← 主工作流（Skill 入口）
├── references/
│   ├── prompt-template.md     ← 完整提示词模板（中英双语，可直接复制）
│   └── figure-types.md       ← 11 种图示类型规范 + 五大翻车问题
└── README.md                  ← 本文件

SKILL.md 配置元数据

---
name: ccf-figure
description: Generate publication-ready scientific figures for AI and computer science papers. Use when the user provides a paper title, abstract, method section, or full paper and wants a top-conference-style research diagram.
---
# CCF Figure

122 个深度学习数据集

🔍

手写数字/街景号码 (2个)

MNIST

手写数字

访问数据集 ↗

Google 房屋号码

街景号码识别

访问数据集 ↗

图像分类（通用） (4个)

CIFAR-10 和 CIFAR-100

图像分类

访问数据集 ↗

ImageNet

大规模图像分类

访问数据集 ↗

Tiny Images

8000万张微小图像

访问数据集 ↗

Flickr 数据 (Yahoo 1亿)

大规模图像研究

访问数据集 ↗

图像分割 (1个)

伯克利分割数据集 500

图像分割

访问数据集 ↗

机器学习通用 (1个)

UCI 机器学习库

通用机器学习

访问数据集 ↗

人脸识别与检测 (9个)

Flickr 8k

图像描述

访问数据集 ↗

加州理工学院图像数据库

小物体识别

访问数据集 ↗

哥伦比亚-乌得勒支反射率纹理库

3D纹理/反射率

访问数据集 ↗

计算色彩恒常性数据

色彩恒常性研究

访问数据集 ↗

计算视觉实验室

计算机视觉

访问数据集 ↗

基于内容的图像检索数据库

CBIR 算法测试

访问数据集 ↗

高效内容检索小组

图像检索

访问数据集 ↗

密集采样视野球体

3D物体识别 (2500张/球体)

访问数据集 ↗

计算机科学 VII (图形系统)

图形学研究

访问数据集 ↗

行人检测与再识别 (7个)

Flickr 30k

图像描述/图网络

访问数据集 ↗

微软 COCO

目标检测/分割/描述

访问数据集 ↗

VQA (视觉质量评估)

视觉问答

访问数据集 ↗

COCO-QA

图像问答

访问数据集 ↗

AT&T 剑桥人脸数据库

人脸识别

访问数据集 ↗

AVHRR 探路者

遥感图像

访问数据集 ↗

空运数据集

光线追踪图像/纹理分割

访问数据集 ↗

文本检测与识别 (4个)

阿姆斯特丹物体图像库 ALOI

物体识别 (110,250张)

访问数据集 ↗

带注释脸部/手部/心脏图像

AAM/ASM分析

访问数据集 ↗

图像分析和计算机图形学

通用图像分析

访问数据集 ↗

布朗大学刺激集

物体识别测试

访问数据集 ↗

NLP / 问答 / 阅读理解 (6个)

CAVIAR 视频序列

人类活动检测/行为分类

访问数据集 ↗

机器视觉单元

机器视觉研究

访问数据集 ↗

CCITT 传真标准图像

图像压缩/处理

访问数据集 ↗

CMU CIL 立体数据

立体视觉

访问数据集 ↗

CMU PIE 数据库

人脸识别 (41,368张)

访问数据集 ↗

CMU VASC 图像数据库

通用图像/立体对

访问数据集 ↗

遥感与航空影像 (15个)

数字胚胎

物体识别系统测试

访问数据集 ↗

明尼苏达大学视觉实验室

视觉研究

访问数据集 ↗

胃肠道视频内窥镜图集

医学影像/内窥镜

访问数据集 ↗

FG-NET 面部衰老数据库

年龄估计/人脸 (1002张)

访问数据集 ↗

FVC2000 指纹数据库

指纹验证 (3520个)

访问数据集 ↗

生物识别系统实验室

生物识别研究

访问数据集 ↗

面部和手势图像序列

人脸/手势识别

访问数据集 ↗

德语手指拼写数据库

手语识别 (35种手势)

访问数据集 ↗

语言处理和模式识别

NLP/模式识别

访问数据集 ↗

格罗宁根自然图像数据库

户外图像 (4000+张 16位)

访问数据集 ↗

ICG 测试站序列

转盘3D重建

访问数据集 ↗

计算机图形学与视觉研究所

图形学/视觉

访问数据集 ↗

IEN 图像库

户外图像 (1000+张)

访问数据集 ↗

INRIA Syntim 图像数据库

简单物体识别

访问数据集 ↗

法国国家信息和自动化研究所

信息/自动化研究

访问数据集 ↗

红外 / 热成像 / 事件相机 (3个)

INRIA Syntim 立体数据库

立体视觉 (34对)

访问数据集 ↗

图像分析实验室数据库

医学/CFA/范围图像

访问数据集 ↗

图像分析实验室

图像分析

访问数据集 ↗

医学影像 (10个)

纹理图像数据库

纹理分析

访问数据集 ↗

JAFFE 面部表情数据库

表情识别 (213张)

访问数据集 ↗

ATR 研究公司

人脸/表情研究

访问数据集 ↗

JISCT 立体评估

立体视觉评估

访问数据集 ↗

MIT Vision Texture

纹理分析 (100+张)

访问数据集 ↗

机器视觉教科书图像

教学/视觉研究

访问数据集 ↗

乳房X线摄影图像数据库

医学影像/乳腺癌检测

访问数据集 ↗

MSU PRIP 图像 FTP

通用图像

访问数据集 ↗

Middlebury 立体数据集

立体视觉 (含GT)

访问数据集 ↗

Middlebury 立体视觉研究

立体视觉

访问数据集 ↗

视频分析 (9个)

MODIS 机载模拟器数据集

遥感/环境建模

访问数据集 ↗

Visible Human 项目

医学影像 (CT/MRI)

访问数据集 ↗

国家设计库

3D CAD模型 (55,000+)

访问数据集 ↗

几何与智能计算实验室

几何计算

访问数据集 ↗

OSU 3D物体模型数据库

3D物体识别

访问数据集 ↗

OSU 范围图像数据库

范围图像 (数百张)

访问数据集 ↗

OSU/SAMPL 数据库

范围图像/3D模型/运动序列

访问数据集 ↗

信号分析与机器感知实验室

信号分析/机器感知

访问数据集 ↗

Otago 光流评估序列

光流估计

访问数据集 ↗

3D / 点云 / 深度 (8个)

视觉研究组 (Otago)

视觉研究

访问数据集 ↗

PIV 粒子图像测速序列

光流/图像匹配

访问数据集 ↗

LIMSI-CNRS 视觉

视觉/图像处理

访问数据集 ↗

法国国立科学研究院

多学科研究

访问数据集 ↗

光度3D表面纹理数据库

3D纹理 (1680张)

访问数据集 ↗

SOFA 光流分析序列

运动分析

访问数据集 ↗

计算机视觉组 (HW)

计算机视觉

访问数据集 ↗

基于流的重建序列

运动结构重建

访问数据集 ↗

图像检索 / 细粒度识别 (7个)

立体图像 (GT视差/遮挡)

立体匹配评估

访问数据集 ↗

斯图加特范围图像数据库

3D范围图像

访问数据集 ↗

部门图像理解

图像理解

访问数据集 ↗

AR 人脸数据库

人脸识别 (4000+张/126人)

访问数据集 ↗

普渡大学机器人视觉实验室

机器人视觉

访问数据集 ↗

MIT-CSAIL 物体和场景数据库

多类检测/场景识别 (72000+张)

访问数据集 ↗

RVL SPEC-DB

镜面高光检测 (300+张)

访问数据集 ↗

行为识别 / 姿态估计 (4个)

机器人视觉实验室 RVL

机器人视觉

访问数据集 ↗

Xm2vts 数据库

人脸/语音 (295人)

访问数据集 ↗

视觉语音信号处理中心

视觉/语音/信号处理

访问数据集 ↗

交通图像序列

交通场景分析

访问数据集 ↗

车辆 / 自动驾驶 (6个)

IAKS/KOGS

AI/认知系统

访问数据集 ↗

奥卢木材和木节数据库

纹理分类 (1000+张)

访问数据集 ↗

UCID 未压缩彩色图像数据库

图像检索

访问数据集 ↗

UMass Vision 图像档案

航空/医学/立体/空间图像

访问数据集 ↗

USF 范围图像数据 (含分割GT)

范围图像分割

访问数据集 ↗

奥卢大学基于物理的面部数据库

人脸/光谱反射率

访问数据集 ↗

特征匹配 / 图像配准 (3个)

机器视觉和媒体处理单元

机器视觉/媒体处理

访问数据集 ↗

奥卢大学纹理数据库

纹理分析 (320种表面)

访问数据集 ↗

机器视觉组 (奥卢)

机器视觉

访问数据集 ↗

目标检测 / 实例分割 (23个)

视场数据库

多视角物体识别

访问数据集 ↗

PRIMA GRAVIR

感知/机器人

访问数据集 ↗

Wiry 物体识别数据库

物体识别/场景理解

访问数据集 ↗

3D Vision 集团 (CMU)

3D视觉

访问数据集 ↗

耶鲁人脸数据库

人脸识别 (165张)

访问数据集 ↗

耶鲁人脸数据库 B

光照/姿态变化 (5760张)

访问数据集 ↗

计算机视觉与控制中心 (Yale)

计算机视觉

访问数据集 ↗

DeepMind QA 语料库

NLP 问答 (300K+文档)

访问数据集 ↗

YouTube-8M 数据集

视频分类 (800万个视频)

访问数据集 ↗

Open Images 数据集

图像分类/检测 (~900万张)

访问数据集 ↗

Fashion-MNIST

时尚产品分类

访问数据集 ↗

DeepFashion 数据库

时尚识别 (800,000+张)

访问数据集 ↗

FakeNewsCorpus

NLP 假新闻检测 (~1000万篇)

访问数据集 ↗

LLVIP

低光视觉/红外-可见光 (30976张)

访问数据集 ↗

MSDA

多源OCR/文本识别 (500万+张)

访问数据集 ↗

SANAD 阿拉伯语新闻

NLP 阿拉伯语文本分类

访问数据集 ↗

Referit3D

3D视觉语言 (~125K)

访问数据集 ↗

SQuAD

NLP 英语问答 (~150K对)

访问数据集 ↗

FQuAD

NLP 法语问答 (~25K对)

访问数据集 ↗

GermanQuAD

NLP 德语问答 (~14K对)

访问数据集 ↗

SberQuAD

NLP 俄语问答 (~90K对)

访问数据集 ↗

ArtEmis

情感注释/艺术理解 (450K条)

访问数据集 ↗

VOC2012 视觉对象分类挑战赛

目标检测/分割 (12K张/20类)

访问数据集 ↗

285+ 即插即用深度学习模块

通用模块

注意力机制 (54个)

Circulant Attention Learners

🎯 Vision Transformer/通用CV 🏛 AAAI 2026

📄 论文 arxiv 💻 代码 GitHub

Structured Awareness: Directional, Frequency-Spatial, and Structural Attention

🎯 医学图像分割 🏛 AAAI 2026

📄 论文 arxiv 💻 代码 GitHub

DCMM-Transformer: Degree-Corrected Mixed-Membership Attention

🎯 医学影像 🏛 AAAI 2026

📄 论文 arxiv

ABDUCTIVEMLLM: Boosting Visual Abductive Reasoning

🎯 多模态推理 🏛 AAAI 2026

📄 论文 arxiv

MODA: Multispectral Object Detection in Aerial Images

🎯 多光谱目标检测 🏛 AAAI 2026

📄 论文 arxiv 💻 代码 GitHub

UCMNet: Uncertainty-Aware Context Memory Network

🎯 屏下摄像头图像恢复 (水平-垂直双注意力) 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

VideoFusion: Spatio-Temporal Collaborative Network

🎯 多模态视频融合 (差分增强注意力) 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

Flickerformer: Periodicity and Directionality for Burst Flicker Removal

🎯 图像去闪烁 (小波注意力) 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

HVI: A New Color Space for Low-light Image Enhancement

🎯 低光增强 (跨注意力) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

U-RWKV: Direction-Adaptive Lightweight Medical Segmentation

🎯 医学图像分割 (挤压激励注意力) 🏛 MICCAI 2025

📄 论文 arxiv 💻 代码 GitHub

MANO: Multipole Attention Mechanism

🎯 CV/物理 (多极注意力) 🏛 ICCV 2025

📄 论文 arxiv 💻 代码 GitHub

Probability-Guided Edge Enhancement Network

🎯 遥感语义分割 (卷积自注意力) 🏛 TGRS 2025

📄 论文 arxiv

CTOD: Cross-Attentive Task-Alignment

🎯 单阶段目标检测 (任务交叉注意力) 🏛 TMM 2024

📄 论文 arxiv

SADT: Scale-Adaptive Deformable Transformer

🎯 图像恢复 (尺度自适应可变形注意力) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

Wavelet and Adaptive Coordinate Attention

🎯 图像去噪 (小波注意力) 🏛 TIM 2024

📄 论文 arxiv

FreqSal: Fourier-embedded Network for RGB-T SOD

🎯 RGB-T显著性检测 (傅里叶残差注意力) 🏛 AAAI 2025

📄 论文 arxiv 💻 代码 GitHub

VolFormer: Cube Interaction for HSI Restoration

🎯 高光谱恢复 (三维立体注意力) 🏛 CVPR 2025

📄 论文 arxiv

TBSN: Transformer Blind-Spot Network

🎯 自监督图像去噪 (通道注意力) 🏛 AAAI 2025

📄 论文 arxiv 💻 代码 GitHub

MCA: Multi-dimensional Collaborative Attention

🎯 通用CV (多维协作注意力) 🏛 EAAI 2023

📄 论文 arxiv 💻 代码 GitHub

MCANet: Multi-Scale Cross-Axis Attention

🎯 医学图像分割 (CV全领域通用) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

RGT: Recursive Generalization Transformer (RG_SA)

🎯 图像超分 (递归泛化自注意力) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

Energy-Based Cross Attention

🎯 文本到图像扩散模型 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

HiLo Attention

🎯 CV 2D (结合高频低频注意力) 🏛 NeurIPS 2022

📄 论文 arxiv

PPA: Parallelized Patch-Aware Attention (HCF-Net)

🎯 红外小目标检测 (CV 2D通用) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

AGCA: Adaptive Graph Channel Attention

🎯 CV 2D/图卷积 (钢表面缺陷检测) 🏛 TIM 2023

📄 论文 arxiv 💻 代码 GitHub

RGA: Relation-Aware Global Attention

🎯 行人重识别 (关系感知全局注意力) 🏛 CVPR 2020

📄 论文 arxiv 💻 代码 GitHub

EGA: Edge-Guided Attention (EGCIFFNet)

🎯 边缘检测/CV 2D图像任务 🏛 TIM 2024

📄 论文 arxiv

Agent Attention: Softmax + Linear Attention

🎯 CV 2D通用 (全新注意力范式) 🏛 ECCV 2024

📄 论文 arxiv 💻 代码 GitHub

SENet: Squeeze-and-Excitation Networks (3D版本)

🎯 3D CV (通道注意力) 🏛 CVPR 2018

📄 论文 arxiv 💻 代码 GitHub

scSE: Spatial and Channel Squeeze & Excitation

🎯 图像分割 (空间通道注意力) 🏛 MICCAI 2018

📄 论文 arxiv

GCT: Gated Channel Transformation

🎯 CV (改进通道注意力) 🏛 CVPR 2020

📄 论文 arxiv

DICAM: Underwater Image Enhancement Attention

🎯 水下图像增强 🏛 Science TM 2022

📄 论文 arxiv

HAAM: Hybrid Adaptive Attention Module (AAU-net)

🎯 医学图像分割 🏛 arXiv 2022

📄 论文 arxiv 💻 代码 GitHub

HWMNet: Half Wavelet Attention on M-Net+

🎯 低光图像增强 🏛 arXiv 2022

📄 论文 arxiv 💻 代码 GitHub

UBRFC-Net: Adaptive Fine-Grained Channel Attention

🎯 图像去雾 (改进SE通道注意力) 🏛 Neural Networks 2024

📄 论文 arxiv 💻 代码 GitHub

SCSA: Spatial and Channel Synergistic Attention

🎯 通用CV (空间通道协同注意力) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

ENLTB: Efficient Non-Local Attention (Perspective+ Unet)

🎯 医学图像分割 🏛 MICCAI 2024

📄 论文 arxiv 💻 代码 GitHub

MLLA: Linear Attention from Mamba Perspective

🎯 CV通用 (继承Mamba优势的线性注意力) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

LDConv: Linear Deformable Convolution Attention

🎯 CV通用 (线性可变形卷积注意力) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

Haar Wavelet High-Low Frequency Attention

🎯 裂缝检测 (基于Haar小波注意力) 🏛 ESWA 2024

📄 论文 arxiv

LGAG: Large Kernel Grouped Attention Gate

🎯 医学图像分割 (大核分组注意力门控) 🏛 CVPR 2024

📄 论文 arxiv

CGLU: Convolutional Gated Linear Unit (TransNeXt)

🎯 CV/NLP通用 (卷积门控通道注意力) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

MLKA: Multi-scale Large Kernel Attention (MAN)

🎯 CV 2D通用 (多尺度大核注意力) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

DAT: Deformable Attention Transformer

🎯 时间序列预测 (可变形注意力) 🏛 CVPR 2022

📄 论文 arxiv 💻 代码 GitHub

FECAM: Frequency Enhanced Channel Attention

🎯 时间序列预测 (频率增强通道注意力) 🏛 arXiv 2022

📄 论文 arxiv 💻 代码 GitHub

DSANet: Dual Self-Attention Network

🎯 时间序列预测 (去稳态注意力) 🏛 CIKM 2019

📄 论文 arxiv 💻 代码 GitHub

Local Flow Attention

🎯 交通流预测 (局部流注意力) 🏛 Neural Networks 2023

📄 论文 arxiv

DCT-Former: Self-Attention with DCT

🎯 时间序列/NLP (离散余弦变换注意力) 🏛 arXiv 2022

📄 论文 arxiv 💻 代码 GitHub

AGF: Attention Gate Fusion (MotionAGFormer)

🎯 3D人体姿态估计 (AGF注意力) 🏛 WACV 2024

📄 论文 arxiv 💻 代码 GitHub

RMT: Retentive Networks Meet Vision Transformers

🎯 CV通用 (保留网络注意力) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

CATANet: Content-Aware Token Aggregation

🎯 轻量级图像超分 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

FSTA-SNN: Frequency-based Spatial-Temporal Attention

🎯 脉冲神经网络 (频域时空注意力) 🏛 AAAI 2025

📄 论文 arxiv 💻 代码 GitHub

HSPAN: High-Similarity-Pass Attention

🎯 图像超分 🏛 TIP 2024

📄 论文 arxiv 💻 代码 GitHub

PMFSNet: Polarized Multi-scale Feature Self-attention

🎯 轻量级医学图像分割 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

卷积模块 (24个)

Partial Channel Network

🎯 轻量级CNN (部分通道卷积) 🏛 AAAI 2026

📄 论文 arxiv 💻 代码 GitHub

Strip R-CNN: Large Strip Convolution

🎯 遥感目标检测 (大条带卷积) 🏛 AAAI 2026

📄 论文 arxiv 💻 代码 GitHub

Remote Sensing Forestry Similarity Convolution

🎯 遥感林业分类 🏛 WACV 2026

📄 论文 arxiv

TM-BSN: Triangular-Masked Blind-Spot Network

🎯 自监督图像去噪 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

SCT-Net: CNN-Transformer Pooling Attention Fusion

🎯 高光谱分类 (2D+3D并行卷积) 🏛 DSP 2025

📄 论文 arxiv 💻 代码 GitHub

MobileIE: Lightweight ConvNet for Mobile IE

🎯 移动端实时图像增强 🏛 ICCV 2025

📄 论文 arxiv 💻 代码 GitHub

ARConv: Adaptive Rectangular Convolution

🎯 遥感全色锐化 (自适应卷积) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

ConverseNet: Reverse Convolution

🎯 图像恢复 (反卷积算子) 🏛 ICCV 2025

📄 论文 arxiv 💻 代码 GitHub

Pinwheel-shaped Convolution

🎯 红外小目标检测 🏛 AAAI 2025

📄 论文 arxiv 💻 代码 GitHub

DEA-Net: Detail-Enhanced Convolution + Content-Guided Attention

🎯 图像去雾/CV 2D通用 🏛 TIP 2024

📄 论文 arxiv 💻 代码 GitHub

CTR-GC: Channel-wise Topology Refinement Graph Conv

🎯 骨架动作识别 (通道拓扑细化图卷积) 🏛 ICCV 2021

📄 论文 arxiv 💻 代码 GitHub

WTConv: Wavelet Convolutions for Large Receptive Fields

🎯 CV 2D通用 (小波变换卷积) 🏛 ECCV 2024

📄 论文 arxiv 💻 代码 GitHub

TVConv: Translation Variant Convolution

🎯 医学分割/人脸识别 (平移变体卷积) 🏛 CVPR 2022

📄 论文 arxiv 💻 代码 GitHub

Dynamic Convolution: Attention over Kernels

🎯 CV通用 (1D/2D/3D动态卷积) 🏛 CVPR 2020

📄 论文 arxiv

PyConv: Pyramidal Convolution

🎯 CV通用 (金字塔卷积) 🏛 arXiv 2020

📄 论文 arxiv 💻 代码 GitHub

Multi-Dilation Rate Channel Convolution

🎯 目标检测 (多膨胀率通道卷积) 🏛 arXiv 2024

📄 论文 arxiv

CondConv: Conditionally Parameterized Convolutions

🎯 CV通用 (经典动态卷积) 🏛 NeurIPS 2019

📄 论文 arxiv 💻 代码 GitHub

DO-Conv: Depthwise Over-parameterized Conv

🎯 CV通用 (替代传统卷积) 🏛 arXiv 2020

📄 论文 arxiv 💻 代码 GitHub

FasterNet: Partial Convolution (PConv)

🎯 轻量级CV 🏛 CVPR 2023

📄 论文 arxiv 💻 代码 GitHub

Large Kernel Convolution Downsampling

🎯 CV通用 (大核卷积下采样) 🏛 arXiv 2022

📄 论文 arxiv 💻 代码 GitHub

LDConv: Linear Deformable Convolution

🎯 CV通用 (线性可变形卷积) 🏛 SCI 2024

📄 论文 arxiv 💻 代码 GitHub

AKConv: Arbitrary Kernel Convolution

🎯 CV通用 (任意采样形状卷积) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

BHViT: Binarized Hybrid Vision Transformer

🎯 轻量级CV (二值化混合ViT) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

FADformer: Frequency-Domain Image Deraining

🎯 图像去雨 (频域卷积) 🏛 ECCV 2024

📄 论文 arxiv 💻 代码 GitHub

频域 (1个)

SFM: Spatial Frequency Modulation

🎯 语义分割 (空间频率调制) 🏛 TPAMI 2026

📄 论文 arxiv 💻 代码 GitHub

特征提取 (32个)

Cross-Modality Feature Adaptive Interaction

🎯 RGB-红外航空目标检测 (跨模态特征自适应) 🏛 TGRS 2026

📄 论文 arxiv

Mesoscopic Insights: Multi-scale & Hybrid Architecture

🎯 图像篡改定位 🏛 AAAI 2025

📄 论文 arxiv

Flora-NET: Dual Coordinate Attention + Adaptive Kernel

🎯 药用花卉识别 🏛 Elsevier 2025

📄 论文 arxiv

Real-World Remote Sensing Image Dehazing

🎯 遥感图像去雾 🏛 TGRS 2025

📄 论文 arxiv 💻 代码 GitHub

I2U-Net: Dual-Path U-Net with MFII

🎯 医学分割 (双分支信息交互特征提取) 🏛 MedIA 2024

📄 论文 arxiv 💻 代码 GitHub

MixDehazeNet: Mix Structure Block

🎯 图像去雾 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

SCConv: Spatial and Channel Reconstruction Convolution

🎯 特征冗余压缩 (CV通用) 🏛 CVPR 2023

📄 论文 arxiv 💻 代码 GitHub

SCSegamba: Lightweight Structure-Aware Vision Mamba

🎯 裂缝分割 (SAVSS模块+MFS头) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

DCMPNet: Depth Information Assisted Collaborative Network

🎯 单图像去雾 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

OTTER: Text-Aware Visual Feature Extraction VLA

🎯 机器人操作 (文本感知视觉特征) 🏛 ICML 2025

📄 论文 arxiv 💻 代码 GitHub

LogicAD: VLM-based Text Feature Extraction

🎯 异常检测 (可解释VLM特征) 🏛 AAAI 2025

📄 论文 arxiv

DDM Deconstruction for Self-Supervised Learning (l-DAE)

🎯 自监督特征学习 (潜在去噪自编码器) 🏛 ICLR 2025

📄 论文 arxiv

Diffusion Models for Sketch-Photo Matching

🎯 零样本草图检索 (扩散模型特征提取) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

LFG-Diffusion: Latent Feature-Guided Diffusion

🎯 阴影去除 (潜在特征引导扩散) 🏛 WACV 2024

📄 论文 arxiv 💻 代码 GitHub

Weak-Mamba-UNet: CNN+ViT+Mamba Hybrid

🎯 涂鸦监督医学分割 (三架构协同) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

BEFUnet: Hybrid CNN-Transformer Architecture

🎯 医学图像分割 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

CCT-LSTM: Compact CNN Transformer + LSTM

🎯 远程压力估计 (多模态特征) 🏛 WACV 2024

📄 论文 arxiv

T-FREX: Transformer-based Feature Extraction

🎯 移动应用评论特征提取 (NER) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

TR-DETR: Task-Reciprocal Transformer

🎯 视频时刻检索+高光检测 (多模态对齐) 🏛 AAAI 2024

📄 论文 arxiv 💻 代码 GitHub

MambaVision: Hybrid Mamba-Transformer Backbone

🎯 视觉主干网络 (Mamba+Transformer混合) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

SaTQA: Transformer-based NR-IQA

🎯 无参考图像质量评估 (监督对比学习) 🏛 AAAI 2024

📄 论文 arxiv 💻 代码 GitHub

Tri-VAE: Triplet Variational Autoencoder

🎯 脑肿瘤MRI异常检测 (无监督) 🏛 CVPRW 2024

📄 论文 arxiv

TSLANet: Time Series Lightweight Adaptive Network

🎯 时序特征提取 (自适应频谱块+交互卷积) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

GraphKAN: Graph Kolmogorov Arnold Networks

🎯 图特征提取 (KAN增强) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

MFDS-DETR: Multi-Level Feature Fusion + Deformable-DETR

🎯 白细胞检测 (多尺度特征融合) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

Efficient LoFTR: Semi-Dense Feature Matching

🎯 图像匹配 (聚合注意力+两阶段相关) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

XFeat: Accelerated Lightweight Image Matching

🎯 轻量级图像匹配 (资源受限设备) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

FourierKAN-GCF: Fourier KAN for Graph CF

🎯 图协同过滤推荐 (傅里叶KAN特征变换) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

LISN: Lightweight Information Split Network

🎯 红外图像超分 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

WaveNet-SF: Wavelet Spatial-Frequency Network

🎯 视网膜疾病检测 (小波变换空频域) 🏛 arXiv 2025

📄 论文 arxiv

MLP-KAN: Deep Representation + Function Learning

🎯 通用深度学习 (MLP+KAN统一) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

WaveletMamba (W-Mamba): Wavelet + SSM Fusion

🎯 红外-可见光图像融合 🏛 arXiv 2025

📄 论文 arxiv 💻 代码 GitHub

特征融合 (14个)

FAAFusion: Fourier Angle Alignment

🎯 遥感旋转目标检测 (傅里叶频域特征融合) 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

LFSB: Differential Dual-Stream Attention (ReflexSplit)

🎯 反射分离 (差分双流注意力融合) 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

TransMixer: CNN+Transformer+Mamba Architecture

🎯 裂缝分割 (三架构协同特征融合) 🏛 CVPR 2026

📄 论文 arxiv

D2T: Dual-Domain Feature Fusion (WPFormer)

🎯 缺陷检测/小目标检测 (双域特征融合) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

Dynamic Feature Fusion for Emotional Mimicry

🎯 情感模仿强度估计 (跨模态动态融合) 🏛 CVPRW 2025

📄 论文 arxiv

ConDSeg: Contrast-Driven Feature Enhancement

🎯 医学图像分割 (对比驱动特征增强融合) 🏛 AAAI 2025

📄 论文 arxiv 💻 代码 GitHub

Haar Wavelet High-Low Frequency Attention Fusion

🎯 裂缝分割 (Haar小波高低频融合) 🏛 ESWA 2024

📄 论文 arxiv

DFF: Dynamic Feature Fusion

🎯 语义边缘检测 (动态特征融合/2D+3D) 🏛 arXiv 2019

📄 论文 arxiv

DASI: Hierarchical Context Fusion (HCF-Net)

🎯 红外小目标检测 (特征融合) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

SDM: Feature Fusion for Segmentation (PnPNet)

🎯 3D医学分割 (特征融合/2D+3D) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

TIF: Transformer Interaction Fusion (DS-TransUNet)

🎯 医学分割 (跳跃连接特征融合) 🏛 arXiv 2021

📄 论文 arxiv

SFFusion: Semantic-Aware Feature Fusion

🎯 红外-可见光融合 (语义感知/2D+3D) 🏛 Information Fusion 2022

📄 论文 arxiv 💻 代码 GitHub

CGAFusion: Content-Guided Attention Fusion (DEA-Net)

🎯 图像去雾 (低级+高级特征融合) 🏛 TIP 2024

📄 论文 arxiv 💻 代码 GitHub

GLSA: Global-Local Spatial Feature Fusion (DuAT)

🎯 医学分割/CV通用 (全局-局部空间融合) 🏛 PRCV 2023

📄 论文 arxiv

下采样 (8个)

ASCNet: Asymmetric Sampling Correction

🎯 红外图像去条纹 (非对称采样校正) 🏛 TIM 2025

📄 论文 arxiv 💻 代码 GitHub

Down-Sampling Rollouts in LLM RL

🎯 LLM强化学习 (下采样优化) 🏛 arXiv 2025

📄 论文 arxiv

DABI: Downsampling in Bilateral Control Imitation

🎯 模仿学习数据增强 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

Group Downsampling with Equivariant Anti-Aliasing

🎯 CV通用 (等变抗混叠群下采样) 🏛 ICLR 2025

📄 论文 arxiv

DS-Pnet: Downsampling Positioning

🎯 FM定位 (下采样定位) 🏛 arXiv 2025

📄 论文 arxiv

ADAPTOR: Adaptive Token Reduction

🎯 视频扩散Transformer (自适应Token下采样) 🏛 CVPRW 2025

📄 论文 arxiv

Dynamic U-Net: Adaptive Feature Calibration

🎯 腹部多器官分割 (自适应下采样) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

UAV-DETR: End-to-End Object Detection

🎯 无人机图像检测 (高效下采样) 🏛 arXiv 2025

📄 论文 arxiv 💻 代码 GitHub

归一化 (10个)

BCN: Batch Channel Normalization

🎯 图像分类 (批通道归一化) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

Lipschitz Normalization

🎯 GAT/Graph Transformer (Lipschitz归一化) 🏛 ICML 2021

📄 论文 arxiv 💻 代码 GitHub

CrossNorm + SelfNorm

🎯 OOD鲁棒性 (两种归一化方式) 🏛 ICCV 2021

📄 论文 arxiv 💻 代码 GitHub

ContraNorm: Contrastive Normalization

🎯 GNN/Transformer (对比归一化层) 🏛 ICLR 2023

📄 论文 arxiv 💻 代码 GitHub

DyT: Transformers without Normalization

🎯 Transformer (替代归一化) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

DiMR: Multi-Resolution Diffusion + Time-Dependent LN

🎯 图像生成 (时间依赖层归一化) 🏛 NeurIPS 2024

📄 论文 arxiv 💻 代码 GitHub

TRIBE: Tri-net Self-Training with Balanced Norm

🎯 测试时自适应 (平衡归一化) 🏛 AAAI 2024

📄 论文 arxiv 💻 代码 GitHub

MABN: Domain-Aware Batch Normalization

🎯 测试时域自适应 🏛 AAAI 2024

📄 论文 arxiv 💻 代码 GitHub

SN-DCR: Spectral Normalization + Dual Contrastive

🎯 图像到图像翻译 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

Hyperspherical Normalization for DRL

🎯 深度强化学习 (超球面归一化) 🏛 arXiv 2025

📄 论文 arxiv 💻 代码 GitHub

多尺度融合 (12个)

DCCS-Det: Directional Cross-Scale Detector

🎯 红外小目标检测 (方向上下文跨尺度) 🏛 TGRS 2026

📄 论文 arxiv 💻 代码 GitHub

DTP: Dual-Path Frequency Structural Decoupling

🎯 低光超分 (频域结构解耦双路径) 🏛 ICME 2026

📄 论文 arxiv 💻 代码 GitHub

FBRT-YOLO: Real-Time Aerial Detection

🎯 实时航空图像检测 🏛 AAAI 2025

📄 论文 arxiv

Lightweight Multiscale Feature Fusion

🎯 航空小目标检测 (轻量级多尺度融合) 🏛 TGRS 2025

📄 论文 arxiv

GLVMamba: Global-Local Visual State-Space Model

🎯 遥感分割 (全局-局部多尺度融合) 🏛 TGRS 2025

📄 论文 arxiv

HISRCNet: SR + Classification for Histopathology

🎯 乳腺癌病理图像超分+分类 🏛 MICCAI 2023

📄 论文 arxiv

CEDNET: Cascade Encoder-Decoder Network

🎯 密集预测 (级联编码-解码) 🏛 ICLR 2023

📄 论文 arxiv

AMD: Adaptive Multi-Scale Decomposition

🎯 时间序列预测 (自适应多尺度分解) 🏛 AAAI 2025

📄 论文 arxiv 💻 代码 GitHub

MF-Mamba: Multi-scale Mamba Fusion

🎯 遥感语义分割 (多尺度Mamba融合) 🏛 TGRS 2025

📄 论文 arxiv 💻 代码 GitHub

MDFM: Multi-Decision Fusing Model

🎯 遥感变化检测 (多尺度差异融合) 🏛 TGRS 2024

📄 论文 arxiv

DFF: Dynamic Feature Fusion (D-Net/DLK)

🎯 3D医学分割 (多尺度动态特征融合) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

CCFF: Cross-Scale Feature Fusion (RT-DETR)

🎯 实时目标检测 (跨尺度特征融合) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

上采样 (1个)

DySample: Learning to Upsample by Learning to Sample

🎯 CV 2D通用 (动态上采样) 🏛 ICCV 2023

📄 论文 arxiv 💻 代码 GitHub

轻量化 (16个)

MobileNetV4: Universal Models for Mobile

🎯 移动端通用 (UIB块) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

FMViT: Multiple-Frequency Mixing ViT

🎯 轻量级视觉主干 (高低频混合) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

Rethinking Attention: Shallow MLP Alternative

🎯 轻量级Transformer (MLP替换注意力) 🏛 AAAI 2024

📄 论文 arxiv 💻 代码 GitHub

Frequency-Enhanced Feature Distillation

🎯 频域增强特征蒸馏轻量化 🏛 ACM MM 2022

📄 论文 arxiv

MobileDenseNet: Lightweight Object Detection

🎯 移动端目标检测 🏛 arXiv 2022

📄 论文 arxiv 💻 代码 GitHub

Skip-Attention: Paying Less Attention

🎯 ViT轻量化 (降低计算量) 🏛 arXiv 2023

📄 论文 arxiv

SHViT: Single-Head ViT

🎯 轻量级ViT (碾压MobileNet/ShuffleNet) 🏛 arXiv 2024

📄 论文 arxiv

Lightweight Stacked Hourglass Network

🎯 视觉感知 (轻量化沙漏网络) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

EfficientViT: Cascaded Group Attention

🎯 ViT高效部署 (级联分组注意力) 🏛 CVPR 2023

📄 论文 arxiv 💻 代码 GitHub

Focus-DETR: Less is More

🎯 轻量化DETR (华为诺亚) 🏛 ICCV 2023

📄 论文 arxiv 💻 代码 GitHub

FalconNet: Lightweight ConvNet Factorization

🎯 轻量级Backbone (汇集所有轻量化优点) 🏛 arXiv 2023

📄 论文 arxiv

MobileViT: Lightweight Mobile ViT

🎯 移动端ViT (CNN+Self-Attention融合) 🏛 ICLR 2022

📄 论文 arxiv 💻 代码 GitHub

EdgeNeXt: CNN-Transformer for Mobile Vision

🎯 移动视觉 (Channel Attention增强CNN) 🏛 ECCVW 2022

📄 论文 arxiv 💻 代码 GitHub

EfficientFormer: ViTs at MobileNet Speed

🎯 移动端Transformer (MobileNet速度) 🏛 NeurIPS 2022

📄 论文 arxiv 💻 代码 GitHub

TinyViT: Fast Pretraining Distillation

🎯 小型ViT (蒸馏预训练) 🏛 ECCV 2022

📄 论文 arxiv 💻 代码 GitHub

MobileOne: 1ms Mobile Backbone

🎯 手机端1ms级主干网 🏛 CVPR 2023

📄 论文 arxiv 💻 代码 GitHub

损失函数 (1个)

Artifact Regularization + Walsh-Hadamard Transform

🎯 低光图像增强 (新损失函数) 🏛 ACM 2025

📄 论文 arxiv

Backbone (2个)

StarNet: Rewrite the Stars

🎯 通用CV Backbone (元素相乘>相加) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

GhostNetV2: GhostModule V1&V2

🎯 CV通用 (替代传统卷积的Ghost模块) 🏛 NeurIPS 2022

📄 论文 arxiv 💻 代码 GitHub

前沿技术专项

KAN (2个)

KAN: Kolmogorov-Arnold Networks

🎯 通用深度学习 (KAN缝合操作指南) 🏛 arXiv 2024

📄 论文 arxiv

SCKansformer: KAN + SCConv Backbone

🎯 骨髓细胞细粒度分类 (KAN+SCConv) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

Mamba (18个)

RFGM: Beyond Illumination for Extreme Dark Restoration

🎯 极暗图像恢复 🏛 AAAI 2026

📄 论文 arxiv 💻 代码 GitHub

C2SSM: Cluster-Centric Scan for UHD Restoration

🎯 超高清图像恢复 (聚类中心扫描) 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

MaIR: Locality- and Continuity-Preserving Mamba

🎯 图像恢复 (局部连续保持Mamba) 🏛 CVPR 2025

📄 论文 arxiv

SCSegamba: Lightweight Structure-Aware Mamba

🎯 裂缝分割 (结构感知轻量Mamba) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

MobileMamba: Lightweight Multi-Receptive Mamba

🎯 轻量级多感受野视觉Mamba 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

MambaHSI: Spatial-Spectral Mamba for HSI

🎯 高光谱图像分类 (空间-光谱Mamba) 🏛 TGRS 2024

📄 论文 arxiv 💻 代码 GitHub

EfficientViM: Efficient Vision Mamba

🎯 CV通用 (Hidden State Mixer SSD) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

ConvSSM: Convolutional State Space Models

🎯 CV 2D通用 (卷积状态空间模型) 🏛 NeurIPS 2023

📄 论文 arxiv 💻 代码 GitHub

nnMamba: 3D Biomedical SSM

🎯 3D医学图像分割/分类/关键点检测 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

TimeMachine: 4 Mambas for Time Series

🎯 时间序列长期预测 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

MambaIR: Mamba for Image Restoration (RSSG)

🎯 图像恢复 (通道注意力+局部增强Mamba) 🏛 ECCV 2024

📄 论文 arxiv 💻 代码 GitHub

RSCaMa: Remote Sensing Change Captioning Mamba

🎯 遥感变化检测/视频理解 (联合时空Mamba) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

Jamba: Hybrid Transformer-Mamba LM

🎯 CV+NLP通用 (混合Transformer-Mamba) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

VMamba: Visual State Space Model (PVMamba)

🎯 医学分割/CV通用 (并行化视觉Mamba) 🏛 NeurIPS 2024

📄 论文 arxiv 💻 代码 GitHub

CM-UNet: Hybrid CNN-Mamba UNet (CSMamba)

🎯 遥感语义分割/CV通用 (CSMamba解码器) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

SegMamba: 3D Medical Image Mamba

🎯 3D医学分割 (2D+3D Mamba卷积) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

WalMaFa: Wavelet Mamba with Fourier Adjustment

🎯 低光图像增强 (小波Mamba+傅里叶调整) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

MambaOut: Do We Really Need Mamba for Vision?

🎯 CV (Mamba必要性探索) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

扩散模型 (2个)

FreeU: Free Lunch in Diffusion U-Net

🎯 扩散模型改进U-Net (无需训练) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

KSA-Edit: All-in-One Slider for Diffusion

🎯 扩散模型图像属性编辑 (轻量级模块) 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

细分任务场景

多模态 (1个)

STC: Multispectral Sensors Color Correction

🎯 手机相机颜色校正 (多光谱传感器) 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

时间序列 (15个)

FusionRegister: IVIF Registration

🎯 红外-可见光图像融合配准 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

Hierarchical Token Compression for Streaming VLLM

🎯 流式视频大语言模型加速 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

CPUBone: Efficient Vision Backbone

🎯 低并行能力设备视觉主干 🏛 CVPR 2026

📄 论文 arxiv 💻 代码 GitHub

TimeBase: Minimalist Long-term Forecasting

🎯 高效长期时间序列预测 🏛 ICML 2025

📄 论文 arxiv 💻 代码 GitHub

DyT: Transformers without Normalization

🎯 Transformer时序建模 (动态Tanh替代) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

TERSE: Temporal Restoration + Spatial Rewiring

🎯 无源多变量时序域自适应 🏛 KDD 2025

📄 论文 arxiv 💻 代码 GitHub

MLOW: Low-Rank Frequency Decomposition

🎯 时间序列预测 (多效应频率分解) 🏛 arXiv 2025

📄 论文 arxiv 💻 代码 GitHub

FreqEvo: Multi-Level Frequency Feature Extraction

🎯 时间序列预测 (多级频域特征) 🏛 TKDE 2025

📄 论文 arxiv

CORA: Covariate-Aware Adaptation

🎯 时序基础模型协变量自适应 🏛 ICLR 2026

📄 论文 arxiv

FITS: Time Series with 10k Parameters

🎯 轻量级时序预测 (频域角度) 🏛 ICLR 2024 Spotlight

📄 论文 arxiv 💻 代码 GitHub

SST: Multi-Scale Hybrid Mamba-Transformer

🎯 长短期时序预测 (Mamba-Transformer混合) 🏛 CIKM 2025

📄 论文 arxiv 💻 代码 GitHub

CrossLinear: Cross-Correlation Embedding

🎯 外生变量时序预测 (即插即用) 🏛 arXiv 2025

📄 论文 arxiv 💻 代码 GitHub

TSLANet: Rethinking Transformers for TS

🎯 时序表示学习 (自适应频谱+交互卷积) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

MSGNet: Multi-Scale Inter-Series Correlations

🎯 多变量时序预测 (多尺度序列关联) 🏛 AAAI 2024

📄 论文 arxiv

PatchTST: Time Series is Worth 64 Words

🎯 NLP时序预测 (补丁时序预测) 🏛 ICLR 2023

📄 论文 arxiv 💻 代码 GitHub

图像分割 (10个)

UACANet: Uncertainty Augmented Context Attention

🎯 息肉分割 (不确定性增强上下文注意力) 🏛 MICCAI 2021

📄 论文 arxiv 💻 代码 GitHub

SFFNet: Wavelet Spatial-Frequency Fusion Network

🎯 遥感分割 (小波空频融合) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

DyCON: Dynamic Uncertainty-aware Consistency

🎯 半监督医学分割 (动态不确定性+对比学习) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

Iris: In-Context Learning for Medical Segmentation

🎯 通用医学分割 (上下文参考引导/解耦架构) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

ConText: In-Context Learning for Text Removal

🎯 文本移除+分割 (上下文学习驱动) 🏛 ICML 2025

📄 论文 arxiv 💻 代码 GitHub

RefLDMSeg: In-Context Segmentation via Latent DM

🎯 上下文分割 (潜在扩散模型) 🏛 AAAI 2025

📄 论文 arxiv 💻 代码 GitHub

HybridGL: Global-Local Representation + Spatial Guidance

🎯 零样本指代图像分割 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

TBConvL-Net: Hybrid CNN-Transformer Architecture

🎯 医学图像分割 (鲁棒混合架构) 🏛 arXiv 2024

📄 论文 arxiv

HResFormer: Hybrid Residual Transformer

🎯 3D医学图像分割 (混合残差Transformer) 🏛 arXiv 2024

📄 论文 arxiv

ScribFormer: CNN+Transformer for Scribble Segmentation

🎯 涂鸦监督医学分割 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

SAM系列 (14个)

ULSAM: Ultra-Lightweight Subspace Attention

🎯 轻量级CV (空间注意力) 🏛 WACV 2020

📄 论文 arxiv 💻 代码 GitHub

CSAM: Cross-Slice Attention Module

🎯 3D医学图像分割/CV通用 (交叉切片注意力) 🏛 WACV 2024

📄 论文 arxiv 💻 代码 GitHub

SAM2-LOVE: SAM2 in Language-Aided AV Scenes

🎯 视听场景分割 (多模态融合+Token传播) 🏛 CVPR 2025

📄 论文 arxiv 💻 代码 GitHub

CRISP-SAM2: Cross-Modal + Semantic Prompting

🎯 多器官分割 (跨模态交互+语义提示) 🏛 ACM MM 2025

📄 论文 arxiv 💻 代码 GitHub

SAM2-SGP: Support-Set Guided Prompting

🎯 医学分割 (支持集引导提示+伪掩码注意力) 🏛 arXiv 2025

📄 论文 arxiv 💻 代码 GitHub

SAMba-UNet: SAM2 + Mamba in UNet

🎯 心脏MRI分割 (SAM2+Mamba+UNet异构融合) 🏛 arXiv 2025

📄 论文 arxiv

SAM2-UNet: SAM2 as Strong Encoder

🎯 自然+医学图像分割 (Hiera骨干+U-Net解码器) 🏛 ICCVW 2025

📄 论文 arxiv 💻 代码 GitHub

SAM2-UNeXT: High-Resolution Baseline

🎯 下游分割任务 (SAM2+DINOv2双分辨率) 🏛 arXiv 2025

📄 论文 arxiv 💻 代码 GitHub

MedSAM2: Segment Anything in 3D Medical

🎯 3D医学图像+视频分割 🏛 arXiv 2025

📄 论文 arxiv 💻 代码 GitHub

EfficientSAM: High-Resolution Generation + Perception

🎯 SAM轻量化 (高效基础视觉模型) 🏛 IEEE TPAMI 2024

📄 论文 arxiv 💻 代码 GitHub

RepViT-SAM: Real-Time Segment Anything

🎯 实时SAM (RepViT加速) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

TinySAM: Efficient Segment Anything (USTC+Huawei)

🎯 高效SAM (突破分割极限) 🏛 AAAI 2024

📄 论文 arxiv 💻 代码 GitHub

EMA: Efficient Multi-Scale Attention (ESAM)

🎯 CV 2D通用 (增强边缘信息) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

DSAM: Temporal-Spatial Brain Network Dynamics

🎯 图像恢复 (注意力模块) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

目标检测 (7个)

FFCA-YOLO: Small Object Detection in RS

🎯 遥感小目标检测 (YOLO轻量级) 🏛 TGRS 2024

📄 论文 arxiv 💻 代码 GitHub

MAGNet: Multi-scale Awareness + Global fusion

🎯 RGB-D显著性目标检测 🏛 KBS 2024

📄 论文 arxiv 💻 代码 GitHub

RemoteDet-Mamba: Hybrid Mamba-CNN for RS Detection

🎯 遥感多模态目标检测 (Mamba-CNN混合) 🏛 arXiv 2024

📄 论文 arxiv

U-DECN: Underwater Object Detection ConvNet

🎯 水下目标检测 (端到端去噪训练) 🏛 arXiv 2024

📄 论文 arxiv

Low-light Object Detection

🎯 低光目标检测 🏛 arXiv 2024

📄 论文 arxiv

DRPCA-Net: Robust PCA for Infrared Small Target

🎯 红外小目标检测 (鲁棒PCA) 🏛 arXiv 2025

📄 论文 arxiv

Cross-view Representation for IR Small Target

🎯 红外小目标检测 (跨视角表征) 🏛 arXiv 2025

📄 论文 arxiv

AI+医学 (7个)

CLEEGN: Plug-and-Play EEG Reconstruction

🎯 自动脑电图信号重建 (即插即用CNN) 🏛 arXiv 2022

📄 论文 arxiv

GLSA: Global-Local Self-Attention (GLSANet)

🎯 医学图像分割 (全局-局部空间聚合) 🏛 PRCV 2023

📄 论文 arxiv

SvANet: Scale-variant Attention Network

🎯 小型医学对象分割 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

EMCAD: Efficient Multi-scale Conv Attention Decoding

🎯 医学图像分割 (高效多尺度注意力解码) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

DEFN: Dual-Encoder Fourier Group Harmonics

🎯 3D医学分割+重建 (模糊边界) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

MASAG: Multi-scale Adaptive Spatial Attention Gate

🎯 医学图像分割 (多尺度自适应注意力门控) 🏛 BMVC 2024

📄 论文 arxiv 💻 代码 GitHub

Vision-LSTM: xLSTM as Generic Vision Backbone

🎯 医学图像分割 (xLSTM视觉主干) 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

CV所有任务 (3个)

RFAConv: Spatial Attention + Standard Convolution

🎯 CV通用 (分类/检测/分割) 🏛 arXiv 2023

📄 论文 arxiv 💻 代码 GitHub

SPABlock: Salient Positions based Attention

🎯 CV通用 (显著位置选择/非卷积非注意力) 🏛 arXiv 2021

📄 论文 arxiv 💻 代码 GitHub

SwiftFormer: Efficient Additive Attention

🎯 CV通用 (轻量高效编码器) 🏛 ICCV 2023

📄 论文 arxiv 💻 代码 GitHub

CV二维任务 (4个)

CoordGate: Spatially-Varying Convolutions

🎯 CV 2D通用 (动态权重调整/非卷积非注意力) 🏛 arXiv 2024

📄 论文 arxiv

CAN: Context-Aware Module for Crowd Counting

🎯 CV 2D通用 (上下文感知/人群计数) 🏛 CVPR 2019

📄 论文 arxiv 💻 代码 GitHub

SSPCAB: Self-Supervised Predictive Conv Attentive Block

🎯 CV 2D通用 (异常检测/图像视频) 🏛 arXiv 2021

📄 论文 arxiv 💻 代码 GitHub

DynamicFilter: Dynamic Frequency Filtering

🎯 CV 2D通用 (频域滤波/动态权重) 🏛 NeurIPS 2016

📄 论文 arxiv

图像超分 (4个)

FMB: Functional Manipulation Benchmark

🎯 轻量级即插即用超分模块 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

SAFMN: Spatially-Adaptive Feature Modulation

🎯 高效图像超分 🏛 ICCV 2023

📄 论文 arxiv 💻 代码 GitHub

ELAN: Efficient Long-Range Attention Network

🎯 图像超分 (高效长程注意力ELAB) 🏛 ECCV 2022

📄 论文 arxiv 💻 代码 GitHub

DAT: Dual Aggregation Transformer

🎯 图像超分 🏛 ICCV 2023

📄 论文 arxiv 💻 代码 GitHub

点云 (7个)

AdaptConv: Adaptive Graph Convolution for PC

🎯 点云分类+分割 (自适应图卷积) 🏛 ICCV 2021

📄 论文 arxiv 💻 代码 GitHub

GeoConv: Geodesic Guided Convolution

🎯 点云/人脸AU识别 (测地线引导卷积) 🏛 arXiv 2020

📄 论文 arxiv

PnP-3D: Plug-and-Play for 3D Point Clouds

🎯 点云增强 (即插即用) 🏛 ICCV 2021

📄 论文 arxiv 💻 代码 GitHub

Point-NN: Non-parametric Point Cloud Analysis

🎯 点云分析 (非参数网络) 🏛 CVPR 2023

📄 论文 arxiv 💻 代码 GitHub

PF-Net: Point Fractal Network

🎯 点云补全 🏛 CVPR 2020

📄 论文 arxiv

ISL: Intra-region Structure Learning (PRA-Net)

🎯 点云分析 (区域内结构学习) 🏛 arXiv 2021

📄 论文 arxiv 💻 代码 GitHub

KPConv: Kernel Point Convolution

🎯 点云特征提取 (灵活可变形点卷积) 🏛 ICCV 2019

📄 论文 arxiv 💻 代码 GitHub

视频预测 (1个)

SimVP: Simpler yet Better Video Prediction

🎯 视频预测 (简化高效) 🏛 CVPR 2022

📄 论文 arxiv 💻 代码 GitHub

3D任务 (4个)

PoseBERT: Generic Transformer for 3D Human

🎯 3D人体建模 (3D任务通用) 🏛 TPAMI 2023

📄 论文 arxiv 💻 代码 GitHub

GKONet: Geometric Knowledge 2D-to-3D Pose

🎯 3D人体姿态估计 (高维先验几何特征) 🏛 IEEE TCSVT 2023

📄 论文 arxiv 💻 代码 GitHub

Deformable LKA: Large Kernel Attention

🎯 3D视觉 (可变形大核注意力) 🏛 WACV 2024

📄 论文 arxiv 💻 代码 GitHub

MoE3D: Mixture-of-Experts for 3D Reconstruction

🎯 3D重建 (像素级深度边界锐度) 🏛 arXiv 2026

📄 论文 arxiv

NLP (1个)

CorNet: Label Correlation Learning

🎯 NLP通用 (即插即用标签相关性学习) 🏛 IEEE Access 2019

📄 论文 arxiv

语音识别 (1个)

FAdam: Natural Gradient Optimizer

🎯 语音/NLP/CV通用 (即插即用优化器) 🏛 arXiv 2024

📄 论文 arxiv

人体姿态估计 (1个)

SmoothNet: Plug-and-Play Pose Refinement

🎯 2D/3D人体姿态估计 (姿态精炼) 🏛 ECCV 2022

📄 论文 arxiv 💻 代码 GitHub

Transformer/Unet专用 (1个)

DA_Block: Dual Attention (DANet)

🎯 场景分割 (可缝合在Transformer或UNet) 🏛 CVPR 2019

📄 论文 arxiv 💻 代码 GitHub

图像恢复 (3个)

NAF: Simple Baselines (NAFNet)

🎯 图像恢复 (即插即用NAF模块) 🏛 ECCV 2022

📄 论文 arxiv 💻 代码 GitHub

Histoformer: Histogram Transformer

🎯 恶劣天气图像恢复 🏛 arXiv 2024

📄 论文 arxiv 💻 代码 GitHub

AST: Adaptive Sparse Transformer

🎯 图像恢复 (自适应稀疏Transformer) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub

语义分割 (2个)

CGRSeg: Context-Guided Spatial Feature Reconstruction

🎯 语义分割 (RCM模块+DPG头) 🏛 ECCV 2024

📄 论文 arxiv 💻 代码 GitHub

CFBConv: Semantic Info CNN Conv (SCTNet)

🎯 实时语义分割 (CFBConv即插即用卷积) 🏛 AAAI 2024

📄 论文 arxiv 💻 代码 GitHub

图像增强 (1个)

FARM: Multi-Scale Feature Alignment (Burstormer)

🎯 图像增强/去噪/暗光/恢复/遥感 (多尺度对齐) 🏛 CVPR 2023

📄 论文 arxiv 💻 代码 GitHub

图像生成 (1个)

SeD: Semantic-Aware Discriminator

🎯 图像生成/超分 (GAN语义感知判别器) 🏛 CVPR 2024

📄 论文 arxiv 💻 代码 GitHub