H-MAS v0.7.0 release
Published:
H-MAS v0.7.0 Feature Preview
“팀 단위로 안전하게 운영한다”
조직/그룹 멀티테넌시, RBAC, 하드웨어 인지 QoS 스케줄링(xxxxxxxxxxx), 추론 API 인프라를 갖춘 Feature Preview 버전입니다.
Highlights
- 멀티테넌시 — Organization/Group 단위 리소스 격리, 멤버십 관리, Cross-Org 접근 전면 차단
- RBAC & 사용자 관리 — 23개 리소스 권한 매트릭스 기반 역할 인가, 사용자 CRUD/프로필/비밀번호 관리
- 클러스터 온보딩 정책 — central/delegated 정책으로 클러스터 등록 권한을 조직 관리자에게 위임 가능
- 하드웨어 인지 스케줄링 — xxxxxxxxxxx QoS 클래스 자동 주입, 클러스터별 스케줄러 타입 관리, 적용 스케줄러/QoS 가시화
- 추론 API 인프라 — OpenAI 호환 프록시, API Key 인증, Redis 기반 Rate Limiting(RPM/TPM), 요청 로깅/뷰어
- HF 토큰 조직 스코핑 — 조직별 HuggingFace 토큰 관리, Gated 모델 배포 사전 차단
- 운영 자동화 — 비동기 작업 큐(asynq), xxxxxxx 고아 Work 감지·자동 정리(GC) 및 알림 UI
- 보안 CI 파이프라인 — Semgrep, gosec, gitleaks, Trivy, hadolint 도입 및 이미지 스캔 게이트
Breaking Changes
- 서빙 런타임 Core 3종 재정비 — Ollama, TGI 런타임 제거. vLLM, llama.cpp, TEI 중심으로 재편 (#299)
- schedulerType enum 변경 —
"default"→"none"(#307) - Helm 기본값 변경 —
redis.enabled기본값false→true(비동기 작업 큐 backing store) (#382)
상세 마이그레이션 가이드는 CHANGELOG.md를 참조하세요.
Quick Start
# 자동 설치 (xxxxxxx + H-MAS)
./scripts/install.sh --registry-token <GHCR-PAT>
# 접속
# 웹 콘솔: http://localhost:30000
# API: http://localhost:30080
상세 설치 가이드: INSTALLATION_GUIDE.md 멤버 클러스터 온보딩 가이드: docs/guide/
Docker Images
| Image | Tag |
|---|---|
ghcr.io/xxxxxxxxxx/hmas-backend | v0.7.0, latest |
ghcr.io/xxxxxxxxxx/hmas-frontend | v0.7.0, latest |
Full Changelog
전체 변경사항은 CHANGELOG.md를 참조하세요.
개발 히스토리
v0.4.0 릴리즈 이후 v0.7.0까지의 주간 개발 기록입니다.
| 기간 | 주요 내용 |
|---|---|
| 2026-06-28 ~ 07-04 | v0.7.0 릴리즈 — 클러스터 온보딩/오프보딩 라이프사이클 강건화, GPU 스케줄러 적용 불변식 확립, 알림 벨 통합 (Iteration 29) |
| 2026-06-21 ~ 06-27 | 고아 Work 자동 감지·정리(GC), 관리 UI, 설정 가능한 클러스터 온보딩 정책 (Iteration 28) |
| 2026-06-14 ~ 06-20 | HF 토큰 조직 스코핑, Gated 모델 사전 차단, 비동기 작업 큐 인프라 (Iteration 27) |
| 2026-06-07 ~ 06-13 | 멀티테넌시 보안 강화(Cross-Org 차단), CI/CD 보안 파이프라인 6종 구축 (Iteration 26) |
| 2026-05-31 ~ 06-06 | 하드웨어 인지 스케줄러 통합 (설치→QoS→디바이스→API→E2E), 런타임 전략 정비 (Iteration 25) |
| 2026-05-24 ~ 05-30 | Organization/Group 멀티테넌시 전 계층 구현, Rate Limit Redis 전환 (Iteration 24) |
| 2026-05-17 ~ 05-23 | 인증/인가 고도화(API Key·사용자 관리·RBAC), 배포 멀티스텝 위자드, 최적화 프리셋 DB화 (Iteration 23) |
| 2026-05-10 ~ 05-16 | 추론 API Key 인증, Rate Limiting, 이미지 워머 OOM 수정 (Iteration 22) |
| 2026-05-03 ~ 05-09 | 추론 요청 로깅 파이프라인, 로그 뷰어·토큰 사용량, 배포 이벤트 히스토리 (Iteration 21) |
| 2026-04-26 ~ 05-02 | 추론 프록시 Phase 1(통합 엔드포인트), 디자인 시스템 정비, 모델 등록 UX (Iteration 20) |
| 2026-04-19 ~ 04-25 | 인플레이스 업데이트 API, Rolling Restart, 파라미터 변경 이력 관리 (Iteration 19) |
| 2026-04-12 ~ 04-18 | 서빙 메트릭 수집 파이프라인(Prometheus 실데이터), 배포 일시정지/재시작 (Iteration 18) |
| 2026-04-05 ~ 04-11 | 서빙 런타임 이미지 관리(2-Layer Resolution), 멀티클러스터 이미지 사전 캐싱 (Iteration 17) |