🧠 IMYME AI Server

"Speak, Learn, Improve."

IMYME 서비스의 핵심 두뇌 역할을 하는 AI 추론 및 오케스트레이션 서버입니다. 고성능 STT 엔진과 Gemini 기반의 지식 평가 시스템을 통해 사용자에게 실시간 피드백을 제공하며, RabbitMQ 기반의 비동기 워커(Worker) 아키텍처로 동작하여 메인 서버와의 결합도를 낮추고 대규모 트래픽에도 안정적으로 대응합니다.

✨ Key AI Features

이 프로젝트는 단순한 API 서버가 아니라, 복합적인 AI 파이프라인을 처리하는 비동기 메시징 엔진입니다.

1. 🐇 Message Driven Architecture (RabbitMQ)

Asynchronous Processing: STT 변환 및 LLM 피드백 생성과 같은 무거운 작업을 HTTP 동기 통신 대신 MQ 기반의 비동기 워커 패턴으로 처리하여 병목을 제거했습니다.
Robust Error Handling: 3회 재시도(Retry) 및 DLQ(Dead Letter Queue, ai.pvp.dlq, ai.solo.dlq) 라우팅을 통해 장애 발생 시에도 데이터 유실 없이 안전하게 예외를 수집합니다.
Horizontal Scaling: 컨슈머 레벨의 prefetch_count를 최적화하여 1개의 서버리스 엔드포인트 내비 다양한 워커가 즉각적으로 트래픽을 분산 및 파이프라이닝할 수 있게 구성했습니다.

2. ⚡️ High-Performance Dual-Model Engine

Speed & Cost: 실시간 피드백 생성과 점수 산정에는 Gemini 3 Flash를 사용하여 응답 속도를 극대화했습니다.
Deep Reasoning: 복잡한 지식 심층 분석 및 평가에는 Gemini 3 Pro를 사용하여 정확한 판단력을 보장합니다.

3. 🤔 Advanced RAG System (Multi-Decision)

Knowledge Verification: 사용자가 말한 내용이 올바른 지식인지 RAG(Retrieval-Augmented Generation) 시스템을 통해 검증합니다.
Multi-Candidate Evaluation: 단순히 가장 유사한 지식 1개만 비교하는 것이 아니라, Top-N개의 후보군을 독립적으로 평가하여 정보의 정합성을 높입니다.

4. 🎙️ Robust STT Pipeline (RunPod Serverless)

Auto-Scaling: GPU가 필요한 STT 워커는 RunPod 위에서 동작하며, 트래픽에 따라 0개에서 N개까지 오토스케일링 되어 비용 효율을 극대화합니다.
Whisper Large v3 Turbo: 최신 모델을 사용하여 한국어 및 IT 기술 용어 인식률을 대폭 끌어올렸습니다.

5. 🏆 Challenge Mode (Dynamic Tournament Engine)

Uncertainty-Guided PAIRS-beam: 다대다 지식 서바이벌 병합 시, 확률적 엔트로피(Entropy) 기반의 빔 서치(Beam Search)를 도입하여 AI의 허위 정보(Hallucination)를 배제하고 지식적 우위를 판별하는 O(N log N) 트리를 자율 구축합니다.
Smart Lua Script Routing: Redis Lua 스크립트를 통해 원자성(Atomicity)을 보장하며, 1대1 병합 조건(PAIR), 홀수 발생 시 부전승(PROMOTE), 대기 상태(WAIT) 등의 상태를 AI 자체적으로 제어하는 무결점 동적 오케스트레이션을 달성했습니다.

🏗️ Architecture

시스템은 크게 메인 서버(Spring)의 요청을 비동기로 수신하는 AI Server (RabbitMQ Worker) 와 실제 GPU 연산을 수행하는 STT Worker (RunPod) 로 분리되어 있습니다.

graph LR
    User[Client] --> GW[Spring Backend]
    
    subgraph "Messaging Layer"
        GW -->|Publish Request| MQ[RabbitMQ]
        AI -->|Publish Response| MQ
    end
    
    subgraph "AI Core (Workers)"
        MQ -->|Consume| AI["AI Server (Python)"]
        AI -->|Generate| GEMINI[Google Gemini API]
        AI -->|State & Lua| REDIS[(Redis Cache & Lua)]
        AI -->|Retrieve| DB[("PostgreSQL + pgvector")]
    end
    
    subgraph "GPU Workload"
        AI -->|Job Request| RP[RunPod Serverless]
        RP -->|Auto-Scale| W1[STT Worker 1]
    end

🚀 Getting Started

Prerequisites

Python 3.11+
RabbitMQ (Local or Amazon MQ)
RunPod Account & API Key
Google Gemini API Key
PostgreSQL (pgvector enabled)
Redis (For Challenge Mode State & Lock)

1. Installation

# Repository 클론
git clone https://github.com/100-hours-a-week/4-team-IMYME-ai.git
cd 4-team-IMYME-ai

# 가상환경 생성 및 의존성 설치
python -m venv venv
source venv/bin/activate
pip install -r ai_server/requirements.txt

2. Configuration (.env)

ai_server/.env 파일을 생성하고 다음 환경변수들을 설정해야 합니다.

# RabbitMQ Connection
RABBITMQ_URL=amqp://guest:guest@localhost:5672/

# Redis
REDIS_URL=redis://localhost:6379/0

# LLM 
GEMINI_API_KEY=your_gemini_api_key

# RunPod GPU STT
RUNPOD_API_KEY=your_runpod_api_key
RUNPOD_ENDPOINT_ID=your_runpod_endpoint_id

# RAG Database
DATABASE_URL=postgresql+psycopg2://user:password@localhost:5432/db_name

3. Run AI Server (Local)

FastAPI 프레임워크를 베이스로 하지만, 메인 역할은 RabbitMQ 워커의 백그라운드 실행입니다. 애플리케이션 시작 시(Lifespan) 모든 큐 수신기가 자동으로 연결됩니다.

# ai_server 폴더 내부에서 실행
uvicorn app.main:app --reload

📚 Communication Interfaces

1. Message Queue (RabbitMQ)

기존 HTTP API로 동작하던 로직은 모두 비동기 큐잉 방식으로 이관되었습니다. 메인 서버는 아래 큐에 JSON Payload로 작업을 요청해야 합니다.

모드	워커 (Worker)	수신 큐 (Request Queue)	발행 큐 (Response Queue)	역할 설명
Solo	Solo STT	`solo.stt.request`	`solo.stt.response`	S3 오디오 파일을 텍스트 변환
Solo	Solo Feedback	`solo.feedback.request`	`solo.feedback.response`	STT 텍스트와 기준을 바탕으로 심층 분석
PvP	PvP STT	`pvp.stt.request`	`pvp.stt.response`	(PvP 전용) 오디오 파일 텍스트 변환
PvP	PvP Feedback	`pvp.feedback.request`	`pvp.feedback.response`	(PvP 전용) 심층 채점 및 페르소나 피드백
Challenge	Challenge STT	`challenge.stt.request`	`challenge.stt.response`	챌린지 참가자 음성 대규모 변환
Challenge	Merge Engine	`challenge.pairs.eval`	`challenge.pairs.eval`	Redis PAIRS-beam 기반 O(N log N) 승자/패자 병합 트릭 노드 생성 (내부 순환)
Challenge	Rank Complete	(Merge 도달)	`challenge.final.done`	최상위 루트 노드 도달 시 최종 랭킹 결과 통합 발행
Challenge	Feedback	`challenge.feedback.request`	`challenge.feedback.response`	1대1 병합 결과 및 랭킹을 바탕으로 참가자 전원에게 1대1 개별 피드백 생성(Fan-Out)

📌 상세한 요청/응답 JSON 스키마 규격은 백엔드 협업용 문서를 참고하세요.

2. REST API (RAG System Only)

메시지 큐 방식이 아닌, 실시간 동기 처리가 필요한 어드민용 지식(Knowledge) 데이터 RAG 시스템 통신만 HTTP API를 유지합니다.

Method	Endpoint	Description
`POST`	`/api/v1/knowledge/candidates/batch`	대량의 면접/기술 지식 데이터를 임베딩 및 DB 적재

📝 Troubleshooting

주요 이슈 및 해결 방법은 TROUBLESHOOTING.md 파일을 참고하십시오.

RabbitMQ Connection Timeout 이슈 해결
RunPod STT Serverless 배포 가이드 및 Cold Start
Pydantic Validation Error 및 DLQ 추적 방법
챌린지 모드 빈 배열(Empty Array) Truthiness 버그 등 엣지 케이스 처리

Name		Name	Last commit message	Last commit date
Latest commit History 211 Commits
.github/workflows		.github/workflows
ai_server		ai_server
stt_server		stt_server
.gitignore		.gitignore
README.md		README.md
TROUBLESHOOTING.md		TROUBLESHOOTING.md
docker-compose.yml		docker-compose.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🧠 IMYME AI Server

✨ Key AI Features

1. 🐇 Message Driven Architecture (RabbitMQ)

2. ⚡️ High-Performance Dual-Model Engine

3. 🤔 Advanced RAG System (Multi-Decision)

4. 🎙️ Robust STT Pipeline (RunPod Serverless)

5. 🏆 Challenge Mode (Dynamic Tournament Engine)

🏗️ Architecture

🚀 Getting Started

Prerequisites

1. Installation

2. Configuration (.env)

3. Run AI Server (Local)

📚 Communication Interfaces

1. Message Queue (RabbitMQ)

2. REST API (RAG System Only)

📝 Troubleshooting

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🧠 IMYME AI Server

✨ Key AI Features

1. 🐇 Message Driven Architecture (RabbitMQ)

2. ⚡️ High-Performance Dual-Model Engine

3. 🤔 Advanced RAG System (Multi-Decision)

4. 🎙️ Robust STT Pipeline (RunPod Serverless)

5. 🏆 Challenge Mode (Dynamic Tournament Engine)

🏗️ Architecture

🚀 Getting Started

Prerequisites

1. Installation

2. Configuration (.env)

3. Run AI Server (Local)

📚 Communication Interfaces

1. Message Queue (RabbitMQ)

2. REST API (RAG System Only)

📝 Troubleshooting

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages