H-MAS release notes (2026-04-26~05-02)

7 minute read

Published:

H-MAS 주간 작업 노트

2026년 4월 26일 - 5월 2일 (Iteration 20)

주요 개발 내용 요약

이번 주는 추론 프록시 Phase 1 구현(#191), 프론트엔드 디자인 시스템 전면 정비(#229→#230→#234→#236), 모델 등록 UX 개선(#223)에 중점을 둔 기간이었습니다. 총 21개의 커밋, 7개의 PR 머지, 8개의 이슈 생성이 완료되었으며, 추론 프록시로 배포된 모델에 단일 통합 엔드포인트를 통한 접근이 가능해졌고, 브랜드 컬러 도입·등록 폼 UX 일관성 확보·제품명 통일 등 프론트엔드 품질을 체계적으로 개선한 주간이었습니다.


새로운 기능 (New Features)

1. 추론 프록시 Phase 1 — 기본 프록시 구현 (Push 모드) (#191 → PR #228)

구현 완료: 배포된 모델에 각 멤버 클러스터의 NodeIP:NodePort를 직접 알 필요 없이 H-MAS 백엔드가 중계하는 단일 통합 엔드포인트(/api/inference/{name}/*)를 통해 추론 요청을 보낼 수 있는 프록시 구현

주요 성과:

  • Backend:
    • /api/inference/:name/* 프록시 핸들러 구현 — 배포명 기반 라우팅, SSE 스트리밍 지원, 구조적 로깅 (START/TTFB/DONE)
    • JWT 인증 확장 — 기존 쿠키(hmas_access) 인증에 Authorization: Bearer <token> 지원 추가로 프로그래매틱 접근(curl, SDK) 지원
    • 에러 핸들링 체계화 — deployment 미존재(404), 미실행(503), 엔드포인트 미구성(502), 연결 실패(502), 타임아웃(504) 구분
    • DB 에러 처리 개선 — GetByName에서 DB 장애와 NotFound 명확 분리
  • Frontend:
    • 배포 상세 페이지에 프록시 엔드포인트 URL 및 curl 사용 예시 카드 추가

검증 완료: 실제 배포 환경(research 클러스터, Qwen2.5-1.5B-Instruct/vLLM)에서 쿠키·Bearer 인증, 비스트리밍·SSE 스트리밍, 에러 케이스 등 7개 TC 통과

관련 커밋: d1c98b1, 1273e8f, 4edf446, 6a5fcb7 (PR #228, Closes #191)


2. 모델 등록 시 HuggingFace 자동 채움 확대 (#223 → PR #224)

구현 완료: 모델 등록 시 “HuggingFace에서 가져오기” 기능의 자동 채움 범위를 기존 5개 필드에서 8개 필드로 확대하여, 사용자 입력 부담 감소 및 리소스 자동 추천 파이프라인 정상 작동

주요 성과:

필드BeforeAfter
카테고리항상 기본값 llmHF pipeline_tag/tags 기반 자동 매핑 (LLM, Vision, Code, Embedding)
파라미터 수 (sizeB)미설정safetensors.total 기반 자동 설정 (fallback: 모델명 파싱)
모델 크기 (size)미설정파라미터 수 기반 표시 문자열 (e.g., 70B)
설명HF description 비어있으면 공란메타데이터 조합 자동 합성
모델 이름org prefix 포함org prefix 자동 제거
리소스 추천sizeB=0이라 미트리거sizeB 자동 설정으로 정상 트리거

관련 커밋: efd1ecd, 81cc3ce, c6720cb, 3f6b56f (PR #224, Closes #223)


3. 디자인 토큰 체계 정립 — 브랜드 컬러 도입 (#230 → PR #233)

구현 완료: H-MAS 고유 브랜드 컬러(쿨 슬레이트 블루) 도입 및 37개 컴포넌트의 하드코딩 컬러를 CSS 변수 기반 디자인 토큰으로 전환하여 향후 화이트라벨링/파트너 브랜딩 대비

주요 성과:

영역변경 내용
globals.cssprimary/ring/chart/sidebar 토큰을 브랜드 컬러로 설정, 다크모드 대응 토큰 정의
뱃지 통일런타임·클러스터 타입·스케줄러 등 무지개색 하드코딩 → zinc 무채색 통일
상태 컬러시맨틱 컬러(green=성공, red=에러, amber=경고) 유지, deleting orange→amber 통일
lib/colors.ts차트/그래프용 브랜드·상태·차트 팔레트 공유 상수 신규 생성

관련 커밋: 235d138, f6f50ee (PR #233, Closes #230)


4. 등록 폼 UX 일관성 확보 — 모달(Dialog) → 드로어(Sheet) 전환

4-1. 클러스터 등록 UI 드로어 전환 (#234 → PR #235)

구현 완료: 클러스터 등록 4단계 위자드를 중앙 모달에서 우측 슬라이드 드로어로 변경하여, 헤더(스텝 인디케이터)·푸터(네비게이션) 고정 배치 및 콘텐츠 독립 스크롤 지원

수정 내용:

  • 네비게이션 버튼을 각 Step에서 SheetFooter로 통합
  • 스케줄러 선택 카드를 3열 그리드에서 세로 스택 레이아웃으로 변경
  • 연결 정보 변경 시 테스트 결과 초기화, 스케줄러 변경 시 사용자 레이블 유지 버그 수정

관련 커밋: b7e6d36 (PR #235, Closes #234)

4-2. 모델 등록/수정 UI 드로어 전환 (#236 → PR #237)

구현 완료: 모델 등록/수정 폼을 중앙 모달에서 우측 슬라이드 드로어로 변경하여, 앱 내 모든 등록 플로우(클러스터, 배치 전략, 리소스 프로파일, 장애복구 정책, 모델)가 동일한 Sheet 패턴을 사용하도록 UX 통일

관련 커밋: 0e1a28c (PR #237, Closes #236)


5. 제품명 H-MAS 통일 및 사이드바 정리 (#229 → PR #232)

구현 완료: 기존 “Serving Platform” 혼용을 “H-MAS”로 통일하여 브랜드 일관성 확보, 사이드바 하단 유저 섹션 제거로 헤더 드롭다운과의 중복 해소

관련 커밋: eee01db (PR #232, Closes #229)


인프라 (Infrastructure)

xxxxxxxxxx xx 코드 리뷰 설정 (#225 → PR #226)

구현 완료: PR 코드 리뷰 품질 향상을 위한 xxxxxxxxxx xx 코드 리뷰 봇 설정 — 한국어 리뷰 출력, 경로별 리뷰 지침(Go 백엔드 에러 핸들링, Next.js 타입 안전성, Helm 보안 등) 구성

관련 커밋: 765759a (PR #226, Closes #225)


문서화 (Documentation)

기술 문서 업데이트 (5건)

문서내용관련 커밋
추론 프록시 테스트 가이드7개 TC 수동 테스트 절차a37dcf7 (PR #228)
모델 벤치마크 기능 PRD벤치마크 기능 PRD 및 로드맵 신규e93d684
시스템 요구사항요구사항 섹션 검토 및 보강2961edb
HP 클러스터 GPU 목록DGX Spark 제거18bc616
명칭 통일h-mas-agent → hmas-agent, 기술 문서·README 최신화cf19fb0, 6159c02

이전 Iteration 계획 달성도

Iteration 19에서 계획한 4개 항목 1개 완료, 3개 미착수 — 추론 프록시 Phase 1을 완료하고, 나머지 시간은 디자인 시스템 전면 정비 및 모델 등록 UX 개선에 집중:

계획이슈상태비고
추론 프록시 Phase 1 구현 착수#191완료PR #228 — 프록시 핸들러 + Bearer 인증 + 엔드포인트 UI
추론 테스트 UI (Chat 인터페이스) 구현#195미착수디자인 시스템 정비에 우선순위 전환
런타임 자동 튜닝 설계 상세화#114미착수동일 사유
h-mas-agent 설계 상세화#190미착수동일 사유

추가 달성: 계획에 없던 디자인 토큰 체계 정립(#230), 브랜딩 통일(#229), 등록 폼 UX 일관성 확보(#234, #236), HuggingFace 자동 채움 확대(#223), CodeRabbit 코드 리뷰 도입(#225) 완료. 모델 벤치마크 PRD 작성 및 문서 최신화.


미해결 이슈 (Open Issues)

신규 이슈 (2개, 이번 Iteration 생성)

이슈제목라벨
#231다크 모드 구현 + 반응형 사이드바 (v0.9+)frontend
#227추론 요청 로그 조회 UIfrontend

#231은 #230(디자인 토큰) 완료에 따른 후속 이슈로, v0.9 Technical Preview 이후 대응 예정 #227은 #193(추론 요청 로깅 파이프라인) 완료 후 착수 예정

추론 프록시 이슈 체인

이슈제목상태
#191추론 프록시 Phase 1: 기본 프록시 구현 (Push 모드)Iteration 20 완료
#192추론 프록시 Phase 2: 멀티클러스터 라우팅 (agent 터널 통합)미착수
#193추론 요청 로깅 및 메트릭 수집 파이프라인미착수
#194추론 API 키 인증 및 Rate Limiting미착수

런타임 자동 튜닝 선행 조건 이슈 체인

이슈제목상태
#125서빙 배포 인플레이스 업데이트 API (PATCH)Iteration 19 완료
#126서빙 배포 파라미터 변경 시 Rolling Restart 파이프라인Iteration 19 완료
#127서빙 런타임 메트릭 수집 파이프라인 구축Iteration 18 완료
#128서빙 최적화 파라미터 변경 이력 관리 및 감사 로그Iteration 19 완료
#114런타임 자동 튜닝 (메트릭 기반 파라미터 자동 조정)선행 조건 4/4 완료 — 착수 가능

이번 주 통계

항목수치
총 커밋 수21개 (+ merge 5건)
머지된 PR7개 (#224, #226, #228, #232, #233, #235, #237)
생성된 이슈8개 (#223, #225, #227, #229, #230, #231, #234, #236)
해결된 이슈7개 (#191, #223, #225, #229, #230, #234, #236)
미해결 이슈29개
신규 기술 문서5건 (추론 프록시 테스트 가이드, 모델 벤치마크 PRD, 시스템 요구사항, GPU 목록, 명칭 통일)
코드 변경량+3,181줄 / -1,540줄 (70개 파일)

결론

이번 주는 추론 프록시 Phase 1 완성과 프론트엔드 디자인 시스템 전면 정비를 병행한 기간이었습니다. 추론 프록시(#191)로 배포된 모델에 단일 통합 엔드포인트를 통한 접근이 가능해져 외부 SDK·curl에서의 프로그래매틱 추론 호출 기반이 마련되었습니다. 동시에 브랜드 컬러 도입(#230), 제품명 통일(#229), 등록 폼 UX 통일(#234, #236) 등 프론트엔드 품질을 체계적으로 개선하여, 향후 화이트라벨링과 파트너 브랜딩에 대비한 디자인 토큰 기반 아키텍처를 구축했습니다.

핵심 성과:

  1. 추론 프록시 Phase 1 완료: 단일 엔드포인트(/api/inference/{name}/*) + JWT Bearer 인증 + SSE 스트리밍 — 실 환경 7개 TC 검증 완료
  2. 디자인 시스템 정비: 브랜드 컬러 도입 + 37개 컴포넌트 토큰화 + 등록 폼 5종 Sheet 패턴 통일
  3. 모델 등록 UX 개선: HuggingFace 자동 채움 확대로 리소스 자동 추천 파이프라인 정상 작동
  4. 개발 프로세스 개선: xxxxxxxxxx xx 코드 리뷰 도입으로 PR 리뷰 품질 향상

다음 주 계획:

  • 추론 테스트 UI (Chat 인터페이스) 구현 (#195)
  • 추론 요청 로깅 및 메트릭 수집 파이프라인 구현 (#193)
  • 런타임 자동 튜닝 설계 상세화 (#114)
  • hmas-agent 설계 상세화 (#190)

문서 작성일: 2026년 5월 3일