H-MAS release notes (2026-04-26~05-02)
Published:
H-MAS 주간 작업 노트
2026년 4월 26일 - 5월 2일 (Iteration 20)
주요 개발 내용 요약
이번 주는 추론 프록시 Phase 1 구현(#191), 프론트엔드 디자인 시스템 전면 정비(#229→#230→#234→#236), 모델 등록 UX 개선(#223)에 중점을 둔 기간이었습니다. 총 21개의 커밋, 7개의 PR 머지, 8개의 이슈 생성이 완료되었으며, 추론 프록시로 배포된 모델에 단일 통합 엔드포인트를 통한 접근이 가능해졌고, 브랜드 컬러 도입·등록 폼 UX 일관성 확보·제품명 통일 등 프론트엔드 품질을 체계적으로 개선한 주간이었습니다.
새로운 기능 (New Features)
1. 추론 프록시 Phase 1 — 기본 프록시 구현 (Push 모드) (#191 → PR #228)
구현 완료: 배포된 모델에 각 멤버 클러스터의 NodeIP:NodePort를 직접 알 필요 없이 H-MAS 백엔드가 중계하는 단일 통합 엔드포인트(/api/inference/{name}/*)를 통해 추론 요청을 보낼 수 있는 프록시 구현
주요 성과:
- Backend:
/api/inference/:name/*프록시 핸들러 구현 — 배포명 기반 라우팅, SSE 스트리밍 지원, 구조적 로깅 (START/TTFB/DONE)- JWT 인증 확장 — 기존 쿠키(
hmas_access) 인증에Authorization: Bearer <token>지원 추가로 프로그래매틱 접근(curl, SDK) 지원 - 에러 핸들링 체계화 — deployment 미존재(404), 미실행(503), 엔드포인트 미구성(502), 연결 실패(502), 타임아웃(504) 구분
- DB 에러 처리 개선 —
GetByName에서 DB 장애와 NotFound 명확 분리
- Frontend:
- 배포 상세 페이지에 프록시 엔드포인트 URL 및 curl 사용 예시 카드 추가
검증 완료: 실제 배포 환경(research 클러스터, Qwen2.5-1.5B-Instruct/vLLM)에서 쿠키·Bearer 인증, 비스트리밍·SSE 스트리밍, 에러 케이스 등 7개 TC 통과
관련 커밋: d1c98b1, 1273e8f, 4edf446, 6a5fcb7 (PR #228, Closes #191)
2. 모델 등록 시 HuggingFace 자동 채움 확대 (#223 → PR #224)
구현 완료: 모델 등록 시 “HuggingFace에서 가져오기” 기능의 자동 채움 범위를 기존 5개 필드에서 8개 필드로 확대하여, 사용자 입력 부담 감소 및 리소스 자동 추천 파이프라인 정상 작동
주요 성과:
| 필드 | Before | After |
|---|---|---|
| 카테고리 | 항상 기본값 llm | HF pipeline_tag/tags 기반 자동 매핑 (LLM, Vision, Code, Embedding) |
파라미터 수 (sizeB) | 미설정 | safetensors.total 기반 자동 설정 (fallback: 모델명 파싱) |
모델 크기 (size) | 미설정 | 파라미터 수 기반 표시 문자열 (e.g., 70B) |
| 설명 | HF description 비어있으면 공란 | 메타데이터 조합 자동 합성 |
| 모델 이름 | org prefix 포함 | org prefix 자동 제거 |
| 리소스 추천 | sizeB=0이라 미트리거 | sizeB 자동 설정으로 정상 트리거 |
관련 커밋: efd1ecd, 81cc3ce, c6720cb, 3f6b56f (PR #224, Closes #223)
3. 디자인 토큰 체계 정립 — 브랜드 컬러 도입 (#230 → PR #233)
구현 완료: H-MAS 고유 브랜드 컬러(쿨 슬레이트 블루) 도입 및 37개 컴포넌트의 하드코딩 컬러를 CSS 변수 기반 디자인 토큰으로 전환하여 향후 화이트라벨링/파트너 브랜딩 대비
주요 성과:
| 영역 | 변경 내용 |
|---|---|
globals.css | primary/ring/chart/sidebar 토큰을 브랜드 컬러로 설정, 다크모드 대응 토큰 정의 |
| 뱃지 통일 | 런타임·클러스터 타입·스케줄러 등 무지개색 하드코딩 → zinc 무채색 통일 |
| 상태 컬러 | 시맨틱 컬러(green=성공, red=에러, amber=경고) 유지, deleting orange→amber 통일 |
lib/colors.ts | 차트/그래프용 브랜드·상태·차트 팔레트 공유 상수 신규 생성 |
관련 커밋: 235d138, f6f50ee (PR #233, Closes #230)
4. 등록 폼 UX 일관성 확보 — 모달(Dialog) → 드로어(Sheet) 전환
4-1. 클러스터 등록 UI 드로어 전환 (#234 → PR #235)
구현 완료: 클러스터 등록 4단계 위자드를 중앙 모달에서 우측 슬라이드 드로어로 변경하여, 헤더(스텝 인디케이터)·푸터(네비게이션) 고정 배치 및 콘텐츠 독립 스크롤 지원
수정 내용:
- 네비게이션 버튼을 각 Step에서
SheetFooter로 통합 - 스케줄러 선택 카드를 3열 그리드에서 세로 스택 레이아웃으로 변경
- 연결 정보 변경 시 테스트 결과 초기화, 스케줄러 변경 시 사용자 레이블 유지 버그 수정
관련 커밋: b7e6d36 (PR #235, Closes #234)
4-2. 모델 등록/수정 UI 드로어 전환 (#236 → PR #237)
구현 완료: 모델 등록/수정 폼을 중앙 모달에서 우측 슬라이드 드로어로 변경하여, 앱 내 모든 등록 플로우(클러스터, 배치 전략, 리소스 프로파일, 장애복구 정책, 모델)가 동일한 Sheet 패턴을 사용하도록 UX 통일
관련 커밋: 0e1a28c (PR #237, Closes #236)
5. 제품명 H-MAS 통일 및 사이드바 정리 (#229 → PR #232)
구현 완료: 기존 “Serving Platform” 혼용을 “H-MAS”로 통일하여 브랜드 일관성 확보, 사이드바 하단 유저 섹션 제거로 헤더 드롭다운과의 중복 해소
관련 커밋: eee01db (PR #232, Closes #229)
인프라 (Infrastructure)
xxxxxxxxxx xx 코드 리뷰 설정 (#225 → PR #226)
구현 완료: PR 코드 리뷰 품질 향상을 위한 xxxxxxxxxx xx 코드 리뷰 봇 설정 — 한국어 리뷰 출력, 경로별 리뷰 지침(Go 백엔드 에러 핸들링, Next.js 타입 안전성, Helm 보안 등) 구성
관련 커밋: 765759a (PR #226, Closes #225)
문서화 (Documentation)
기술 문서 업데이트 (5건)
| 문서 | 내용 | 관련 커밋 |
|---|---|---|
| 추론 프록시 테스트 가이드 | 7개 TC 수동 테스트 절차 | a37dcf7 (PR #228) |
| 모델 벤치마크 기능 PRD | 벤치마크 기능 PRD 및 로드맵 신규 | e93d684 |
| 시스템 요구사항 | 요구사항 섹션 검토 및 보강 | 2961edb |
| HP 클러스터 GPU 목록 | DGX Spark 제거 | 18bc616 |
| 명칭 통일 | h-mas-agent → hmas-agent, 기술 문서·README 최신화 | cf19fb0, 6159c02 |
이전 Iteration 계획 달성도
Iteration 19에서 계획한 4개 항목 1개 완료, 3개 미착수 — 추론 프록시 Phase 1을 완료하고, 나머지 시간은 디자인 시스템 전면 정비 및 모델 등록 UX 개선에 집중:
| 계획 | 이슈 | 상태 | 비고 |
|---|---|---|---|
| 추론 프록시 Phase 1 구현 착수 | #191 | 완료 | PR #228 — 프록시 핸들러 + Bearer 인증 + 엔드포인트 UI |
| 추론 테스트 UI (Chat 인터페이스) 구현 | #195 | 미착수 | 디자인 시스템 정비에 우선순위 전환 |
| 런타임 자동 튜닝 설계 상세화 | #114 | 미착수 | 동일 사유 |
| h-mas-agent 설계 상세화 | #190 | 미착수 | 동일 사유 |
추가 달성: 계획에 없던 디자인 토큰 체계 정립(#230), 브랜딩 통일(#229), 등록 폼 UX 일관성 확보(#234, #236), HuggingFace 자동 채움 확대(#223), CodeRabbit 코드 리뷰 도입(#225) 완료. 모델 벤치마크 PRD 작성 및 문서 최신화.
미해결 이슈 (Open Issues)
신규 이슈 (2개, 이번 Iteration 생성)
| 이슈 | 제목 | 라벨 |
|---|---|---|
| #231 | 다크 모드 구현 + 반응형 사이드바 (v0.9+) | frontend |
| #227 | 추론 요청 로그 조회 UI | frontend |
#231은 #230(디자인 토큰) 완료에 따른 후속 이슈로, v0.9 Technical Preview 이후 대응 예정 #227은 #193(추론 요청 로깅 파이프라인) 완료 후 착수 예정
추론 프록시 이슈 체인
| 이슈 | 제목 | 상태 |
|---|---|---|
| #191 | 추론 프록시 Phase 1: 기본 프록시 구현 (Push 모드) | Iteration 20 완료 |
| #192 | 추론 프록시 Phase 2: 멀티클러스터 라우팅 (agent 터널 통합) | 미착수 |
| #193 | 추론 요청 로깅 및 메트릭 수집 파이프라인 | 미착수 |
| #194 | 추론 API 키 인증 및 Rate Limiting | 미착수 |
런타임 자동 튜닝 선행 조건 이슈 체인
| 이슈 | 제목 | 상태 |
|---|---|---|
| #125 | 서빙 배포 인플레이스 업데이트 API (PATCH) | Iteration 19 완료 |
| #126 | 서빙 배포 파라미터 변경 시 Rolling Restart 파이프라인 | Iteration 19 완료 |
| #127 | Iteration 18 완료 | |
| #128 | 서빙 최적화 파라미터 변경 이력 관리 및 감사 로그 | Iteration 19 완료 |
| #114 | 런타임 자동 튜닝 (메트릭 기반 파라미터 자동 조정) | 선행 조건 4/4 완료 — 착수 가능 |
이번 주 통계
| 항목 | 수치 |
|---|---|
| 총 커밋 수 | 21개 (+ merge 5건) |
| 머지된 PR | 7개 (#224, #226, #228, #232, #233, #235, #237) |
| 생성된 이슈 | 8개 (#223, #225, #227, #229, #230, #231, #234, #236) |
| 해결된 이슈 | 7개 (#191, #223, #225, #229, #230, #234, #236) |
| 미해결 이슈 | 29개 |
| 신규 기술 문서 | 5건 (추론 프록시 테스트 가이드, 모델 벤치마크 PRD, 시스템 요구사항, GPU 목록, 명칭 통일) |
| 코드 변경량 | +3,181줄 / -1,540줄 (70개 파일) |
결론
이번 주는 추론 프록시 Phase 1 완성과 프론트엔드 디자인 시스템 전면 정비를 병행한 기간이었습니다. 추론 프록시(#191)로 배포된 모델에 단일 통합 엔드포인트를 통한 접근이 가능해져 외부 SDK·curl에서의 프로그래매틱 추론 호출 기반이 마련되었습니다. 동시에 브랜드 컬러 도입(#230), 제품명 통일(#229), 등록 폼 UX 통일(#234, #236) 등 프론트엔드 품질을 체계적으로 개선하여, 향후 화이트라벨링과 파트너 브랜딩에 대비한 디자인 토큰 기반 아키텍처를 구축했습니다.
핵심 성과:
- 추론 프록시 Phase 1 완료: 단일 엔드포인트(
/api/inference/{name}/*) + JWT Bearer 인증 + SSE 스트리밍 — 실 환경 7개 TC 검증 완료 - 디자인 시스템 정비: 브랜드 컬러 도입 + 37개 컴포넌트 토큰화 + 등록 폼 5종 Sheet 패턴 통일
- 모델 등록 UX 개선: HuggingFace 자동 채움 확대로 리소스 자동 추천 파이프라인 정상 작동
- 개발 프로세스 개선: xxxxxxxxxx xx 코드 리뷰 도입으로 PR 리뷰 품질 향상
다음 주 계획:
- 추론 테스트 UI (Chat 인터페이스) 구현 (#195)
- 추론 요청 로깅 및 메트릭 수집 파이프라인 구현 (#193)
- 런타임 자동 튜닝 설계 상세화 (#114)
- hmas-agent 설계 상세화 (#190)
문서 작성일: 2026년 5월 3일