Welcome to On-Device AI: ON THE AIr repository! We aim to research On-Device AI with an emphasis on common model compression techniques, conducting paper reviews, and benchmarking real-world performance using NVIDIA Jetson devices. Join us in advancing On-Device AI through open collaboration and innovation! 🚀
"Propose the optimal model compression techniques for NVIDIA Jetson devices by leveraging the knowledge gained from research paper reviews on model compression methods."
- Learn various pruning techniques during this season (10th).
- Apply the learned model compression methods to existing models.
- Test the actual performance on the NVIDIA Jetson platform.
- Share the results for collaborative insights and community contribution.
- Foster synergy between individual growth and collective intelligence.
- Promote a knowledge-sharing culture based on the open-source spirit.
| 역할 | 이름 | 기술 스택 배지 | 주요 관심 분야 |
|---|---|---|---|
| Project Manager | 정현우 | On-Device AI, CV, Robotics | |
| Member | 김민성 | - | |
| Member | 구승연 | - | |
| Member | 문규식 | - | |
| Member | 박선영 | - | |
| Member | 박예리 | - | |
| Member | 양문기 | - | |
| Member | 최예제 | - | |
| Member | 최유진 | - | |
| Member | 최해인 | - |
gantt
title 2025 On-Device AI 프로젝트 여정
section 전체 커리큘럼
Pruning :a1, 2025-03-03, 119d
Quantization :a2, after a1, 120d
section Pruning 세부 활동
SPECIFIC OR UNIVERSAL SPEEDUP :b1, 2025-03-03, 35d
WHEN TO PRUNE :b2, after b1, 84d
section 실습 세부 활동 with Jetson
Object Detection with Pruning :c1, 2025-04-01, 63d
LLM with Pruning :c2, after c1, 30d
CV with Pruning :c3, after c1, 30d
| 날짜 | 내용 | 진행방식 | 비고 |
|---|---|---|---|
| 2025/04/01 | OT 및 계획 수립 | 온라인 | |
| 2025/04/15 | Object Detection Model 선정 | 온라인 | |
| 2025/04/29 | [PDT] Sparsity Regularization based Method 구현 및 테스트 | 온라인 | Magical Week |
| 2025/05/06 | ASP 기반 모델 학습 | 온라인 | |
| 2025/05/13 | TensorRT 변환 및 HW 내 성능 비교 | 오프라인 | PseudoCon |
| 2025/05/20 | [PDT] Sparse Training based Methods 구현 및 테스트 | 온라인 | |
| 2025/05/27 | [PDT] Score-based Methods 구현 및 테스트 | 온라인 | |
| 2025/06/03 | [PDT] Differentiable Pruning based methods 구현 및 테스트 | 온라인 | |
| 2025/06/10 | [PDT] 구현된 모델들 TensorRT 변환 및 HW 성능 비교 | 오프라인 | |
| 2025/06/17 | [PAT] LTH and its Variants 구현 및 테스트 | 온라인 | |
| 2025/06/24 | [PAT] Pruning in Early Training 구현 및 테스트 | 온라인 | |
| 2025/07/01 | [PAT] Post-Training Pruning 구현 및 테스트 | 온라인 | |
| 2025/07/08 | Run-time Pruning 구현 및 테스트 | 온라인 |
매주 스터디 진행 방식은 다음과 같습니다.
- 근황 이야기 (20 ~ 30분 예상)
- 발표자를 제외한 참여자들이 준비한 On-Device AI 관련된 이슈들을 공유한다. (20 ~ 40분 예상)
- 발표자는 준비한 논문 리뷰를 발표한다. (30분 ~ 1시간 예상)
이에 따라 다음 내용들을 준비하시면 됩니다
공통사항
- 해당 주차 논문을 읽는다.
발표자
- 해당 주차 논문에 대한 발표 준비를 한다.
참여자
- On-Device AI와 관련된 기술들(TensorRT, LiteRT, ONNX 등)의 트렌드나 이슈를 준비한다.
세부 논문들은 주차별 활동 내 참고자료 참고
참고 문헌
진행 정보
- 시간: 매주 수요일 오후 8시
- 장소: 온라인 / 오프라인(강남역)
참여 조건
- On-Device AI(경량화, 최적화 등)에 관심 있으신 분
- 4개월 동안 꾸준히 참여하실 수 있는 분
- 딥러닝 기초 지식 보유하신 분
- 논문을 읽고 리뷰하실 수 있는 분
팀원으로 참여하시려면 러너 모집 기간에 신청해주세요.
- 링크 (준비중)
누구나 청강을 통해 모임을 참여하실 수 있습니다.
- 특별한 신청 없이 정기 모임 시간에 맞추어 디스코드 #Room-GH 채널로 입장
- Magical Week 중 행사에 참가
- Pseudo Lab 행사에서 만나기
Pseudo-Lab is a non-profit organization focused on advancing machine learning and AI technologies. Our core values of Sharing, Motivation, and Collaborative Joy drive us to create impactful open-source projects. With over 5k+ researchers, we are committed to advancing machine learning and AI technologies.
This project is licensed under the MIT License.
