메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

LLM 서비스 설계와 최적화

비용은 낮추고 성능은 극대화하는 AI 서비스 구축과 운영 가이드

한빛미디어

번역서

판매중

  • 저자 : 슈레야스 수브라마니암
  • 번역 : 김현준 , 박은주
  • 출간 : 2025-04-10
  • 페이지 : 296 쪽
  • ISBN : 9791169213646
  • eISBN : 9791169219297
  • 물류코드 :11364
  • 초급 초중급 중급 중고급 고급
5점 (2명)
좋아요 : 4

생성형 AI의 경쟁력을 높이는 LLM 최적화 전략

 

AI와 머신러닝의 발전으로 거대 언어 모델(LLM)에 대한 관심은 급증했지만, 높은 비용 때문에 수많은 기업이 도입을 주저하고 있습니다. 이 책은 적은 비용으로 LLM을 구축하고 배포하는 효율적인 접근법을 소개합니다. 모델 선택, 프롬프트 엔지니어링, 파인튜닝, 배포의 각 단계에서 성능을 지나치게 희생하지 않으면서 비용을 최소화하는 방법을 만나 보세요.
검색 시스템이나 AI 에이전트와 같은 생성형 AI 애플리케이션 구현에 필요한 실용적이고 기술적인 지식을 제공합니다. 모델 양자화, 스케일링 등의 추론 최적화 기법과 인프라 비용 절감 방법을 탐구하여 생성형 AI 서비스의 경쟁력을 강화해 보세요.

 

슈레야스 수브라마니암 저자

슈레야스 수브라마니암

AWS의 수석 데이터 과학자입니다. 아마존 내부 팀과 대기업 고객을 대상으로 생성형 AI 애플리케이션의 대규모 구축, 튜닝 및 배포의 컨설팅을 맡고 있습니다. 기초 모델을 위한 고급 훈련, 튜닝 및 배포 기술의 최첨단 연구 개발을 담당하며, 머신러닝 중심의 비용 최적화 워크숍을 운영하여 클라우드에서 인공지능 애플리케이션의 비용을 절감하는 법을 컨설팅합니다.

슈레야스 수브라마니암 역자

김현준

네이버에서 웨일 브라우저를 개발하는 엔지니어로 웹 기술에 큰 관심을 가지고 있습니다. 크로미움 오픈 소스에서 커미터로 활동했으며, 최근에는 AI 기술의 놀라운 발전 흐름을 따라 가기 위해 힘쓰고 있습니다. 특히 AI 안전에 큰 관심을 두고 머신 언러닝과 같은 기술을 탐구합니다.

슈레야스 수브라마니암 역자

박은주

현재 딥러닝 분야에서 개인정보보호와 관련한 다양한 주제를 연구하고 있습니다. 챗GPT가 등장한 이후로 AI 연구의 새로운 변화가 일어남을 감지해 LLM에 대한 깊은 호기심을 품고 이 분야의 탐구를 시작하게 되었습니다.

CHAPTER 1 LLM 기초
_1.1 생성형 AI 애플리케이션과 LLM
_1.2 생성형 AI 애플리케이션의 상용화를 위한 길
_1.3 비용 최적화의 중요성
_1.4 요약

 

CHAPTER 2 비용 최적화를 위한 튜닝 기법
_2.1 파인튜닝 및 커스터마이징
_2.2 파라미터 효율적 파인튜닝(PEFT)
_2.3 PEFT의 비용 및 성능에 대한 영향
_2.4 요약

 

CHAPTER 3 비용 최적화를 위한 추론 테크닉
_3.1 추론 테크닉 소개
_3.2 프롬프트 엔지니어링
_3.3 벡터 스토어를 이용한 캐싱
_3.4 긴 문서를 관리하는 체인
_3.5 텍스트 요약
_3.6 효율적인 추론을 위한 배칭 프롬프트
_3.7 모델 최적화 방법
_3.8 파라미터 효율적 파인튜닝(PEFT)
_3.9 비용 및 성능 영향
_3.10 요약

 

CHAPTER 4 모델 선택과 대안
_4.1 모델 선택의 중요성
_4.2 효율적인 소형 모델
_4.3 성공적인 소형 모델 사례
_4.4 도메인 특화 모델
_4.5 범용 모델을 활용한 프롬프트의 성능
_4.6 요약

 

CHAPTER 5 인프라 및 배포 튜닝 전략
_5.1 튜닝 전략
_5.2 하드웨어 활용 및 배치 튜닝
_5.3 추론 가속화 도구
_5.4 모니터링과 옵저버빌리티
_5.5 요약

 

CHAPTER 6 성공적인 생성형 AI 도입의 열쇠
_6.1 성능과 비용의 균형
_6.2 생성형 AI 애플리케이션의 미래 트렌드
_6.3 요약

이제 AI 서비스의 핵심은 최적화!
LLM 서비스 설계의 모든 것을 배운다!


딥시크처럼 적은 투자로 높은 성능을 내는 LLM이 등장하며, AI 개발 과정에 최적화라는 키워드가 새로이 떠올랐습니다. 이 책은 소형 모델(SLM) 활용법, 효과적인 프롬프트 엔지니어링, 파인튜닝, 양자화 기법까지, 기업과 개발자들이 효율적인 투자로 고성능의 AI 서비스를 구축하는 데 필요한 모든 방법론과 이론을 다룹니다. 다양한 이론과 사례 연구로 효과적인 인사이트를 얻어 보세요. AI 기술 도입 비용으로 고민하는 국내 스타트업과 기업, 개발자라면 반드시 참고해야 할 지침서입니다.
 

주요 내용

  • LLM의 높은 계산 비용 문제를 해결하는 효과적인 기법
  • 비용 효율적인 생성 AI 서비스를 만드는 파인튜닝과 추론, 양자화 기법
  • 소형 모델, 도메인 특화 모델 등 대안 모델
     

대상 독자

  • 효율적인 AI 모델을 구축, 튜닝, 배포하고 싶은 실무 엔지니어
  • AI 서비스에 대한 비즈니스적인 평가를 내리려는 기획자 및 결정권자
  • LLM을 비롯한 인공지능 모델의 전반적인 기술을 알고 싶은 개발자
  • 생성형 AI 및 LLM을 연구하는 학생 및 교수

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.

LLM 서비스 설계와 최적화

이 책은 생성형 AI와 LLM(대규모 언어 모델)의 활용에 있어 핵심 과제인 비용 최적화에 초점을 맞춘 종합적인 가이드다. 현재 AI 개발 환경에서 딥시크와 같은 소형 모델의 등장으로 '적은 투자로 높은 성능'이라는 최적화 패러다임이 주목받고 있는 시점에, 이 책은 실용적인 관점에서 LLM 서비스의 효율적 구축 방법을 제시한다.

주요 강점

체계적인 접근: 책의 구성은 기초 개념부터 고급 최적화 기법까지 단계적으로 설명하여 AI 기술 도입의 전체 흐름을 파악할 수 있게 한다. 1장에서 생성형 AI의 기초와 상용화 과정을 설명하고, 점진적으로 깊이 있는 기술적 내용으로 진행되는 구조는 독자의 이해도를 고려한 설계로 보인다.

다양한 최적화 기법 소개: 2~3장에서 다루는 파인튜닝, PEFT(Parameter-Efficient Fine-Tuning), 그리고 다양한 추론 테크닉은 LLM 활용 시 발생하는 비용 문제에 대한 다각적인 접근법을 보여준다. 특히 벡터 스토어를 이용한 캐싱, 효율적인 추론을 위한 배칭 프롬프트 등은 AI 서비스 운영에 참고할 만한 내용이다.

균형 잡힌 시각: 4장의 모델 선택과 대안, 6장의 성능과 비용의 균형에 관한 논의는 기술적 측면뿐만 아니라 비즈니스적 가치 평가에도 통찰을 제공한다. 이는 기술 구현과 비즈니스 요구 사항 사이의 균형점을 찾고자 하는 독자들에게 유용한 관점을 제시한다.

생성형 AI의 기초와 비용 최적화의 중요성

1장은 생성형 AI 애플리케이션과 LLM의 기본 개념부터 시작하여 상용화 과정에서 마주하는 도전 과제들을 설명한다. 특히 '비용 최적화의 중요성'을 강조함으로써 이후 내용의 필요성을 분명히 하고 있다. 이 부분은 AI 기술 도입을 고려하는 기업과 개발자들에게 왜 최적화가 중요한지에 대한 명확한 근거를 제공한다.

파인튜닝과 PEFT

2장은 파인튜닝 및 커스터마이징 기법과 함께, 파라미터 효율적 파인튜닝(PEFT)을 중점적으로 다룬다. PEFT는 전체 모델 파라미터의 일부만 조정함으로써 계산 비용을 절감하는 방법론으로, 책에서는 이 기법의 비용 및 성능에 대한 영향을 분석하고 있다. 이 장은 기술적 깊이와 실용적 접근을 동시에 제공하려는 시도가 엿보인다.

추론 최적화 기법의 다양성

3장은 책의 가장 실용적인 부분으로, 프롬프트 엔지니어링부터 텍스트 요약, 배칭 프롬프트, 모델 최적화 방법까지 다양한 추론 테크닉을 소개한다. 이 장은 특히 LLM을 실제 서비스에 적용할 때 발생하는 다양한 상황에 대응할 수 있는 기법들을 다루고 있어, 개발자들이 참고하기에 좋은 자료가 될 것으로 보인다.

소형 모델과 대안 모델의 가능성

4장에서는 GPT-4와 같은 대형 모델 대신 소형 모델(SLM) 및 도메인 특화 모델을 활용하는 전략을 제시한다. '효율적인 소형 모델'과 '성공적인 소형 모델 사례'를 통해 대안 모델의 실질적인 가능성을 보여주는 부분은 비용 제약이 있는 기업들에게 유용한 정보를 제공한다. 또한 '범용 모델을 활용한 프롬프트의 성능' 섹션은 기존 모델을 최대한 활용하는 방안을 탐색하는 현실적인 접근법을 보여준다.

인프라 및 배포 전략의 중요성

5장은 인프라 및 배포 튜닝 전략을 다루는데, 하드웨어 활용부터 모니터링과 옵저버빌리티까지 서비스 운영 측면에서의 최적화를 포괄적으로 설명한다. 이 장은 개발 단계를 넘어 지속적인 서비스 운영에 필요한 인프라 최적화의 중요성을 강조하며, 실제 서비스 배포 시 고려해야 할 요소들을 제시한다.

성능과 비용의 균형

6장은 '성능과 비용의 균형'이라는 주제로 이 책의 핵심 메시지를 다시 한번 강조한다. 생성형 AI 애플리케이션의 미래 트렌드를 전망하면서, 책 전체를 통해 소개된 다양한 최적화 기법들을 어떻게 실제 비즈니스 상황에 적용할 수 있는지에 대한 종합적인 시각을 제공한다.


이 책은 생성형 AI 서비스 구축에 있어 가장 중요한 과제인 '비용 최적화'에 초점을 맞춰, 이론적 배경과 실용적 접근을 함께 제시하고 있다. 전체 6장에 걸쳐 LLM의 기초부터 최적화 기법, 모델 선택, 인프라 전략까지 포괄적인 내용을 다루고 있어, AI 개발과 관련된 다양한 측면을 이해하는 데 도움이 된다.

특히 국내 스타트업과 기업 환경에서 제한된 자원으로 효과적인 AI 서비스를 구축하고자 하는 이들에게 유용한 참고 자료가 될 것으로 보인다. 기술의 깊이와 비즈니스적 통찰을 모두 담고 있어, AI 개발 팀 전체가 참고할 만한 가치가 있으며, 급변하는 AI 기술 환경에서 지속 가능한 서비스 구축을 위한 다양한 관점을 제공한다.

다만, 일부 내용에서는 더 구체적인 사례나 실험 결과, 그리고 각 기법의 한계점에 대한 더 깊은 논의가 있었다면 독자들에게 더 균형 잡힌 시각을 제공했을 것이다. 그럼에도 불구하고, 이 책은 LLM 기반 서비스의 비용 최적화라는 중요한 주제를 체계적으로 다루고 있어, AI 기술을 실제 비즈니스에 적용하고자 하는 이들에게 유익한 안내서가 될 것이다.

한빛미디어 서평단 <나는 리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.

 

 LLM 서비스 설계와 최적화 - 저자: 슈레야스 수브라마니암
 번역 : 김현준, 박은주 

 

생성형 AI와 LLM은 복잡한 작업을 수행하기 때문에 상당한 컴퓨팅 자원이 필요하다. 방대한 컴퓨팅 자원 수요를 해결하기 위해 기술을 도입하는 비용은 조직에게 부담이 된다. 실제로 책에서 말하는 바에 따르면 최첨단 AI 모델 훈련비용이 2016년 이후 매년 2.4배씩 증가하고 있다고 한다. 현재 가장 비용이 많이 든 공개 모델은 우리가 익히 잘아는 GPT-4와 구글의 Gemini Ultra이다. 모델 서비스를 유지하는데도 상당한 비용이 든다. 오픈 AI는 모델 서비스를 유지하는데 하루에 70만 달러를 사용한다고 한다. 

따라서, LLM 서비스를 도입하고자 하는 기업에게는 비용 최적화가 가장 중요한 과제가 된다. 이 책에서 가장 재미있게 읽었던 3장은 LLM에 중점을 두고 추론 비용을 최적화하는 다양한 기술을 소개한다. 그중에서 한가지가 바로 프롬프트 엔지니어링이다. 프롬프트에 대한 이해도는 작업의 성능과 비용에 큰 영향을 미친다고 한다. 

 

프롬프트 엔지니어링은 LLM과 상호작용할 때 중심이 되는 기법으로, 모델이 원하는 출력을 생성할 수 있도록 프롬프트를 구성하는 것을 말한다. 


 

프롬프트와 모델의 응답에서 사용하는 각 단어나 토큰은 비용을 발생시키는데, 오픈 AI의 GPT-4o는 입력 100만 토큰당 2.50달러이고, 출력은 동일 토큰에 10달러의 비용이 든다. 이를 추정하기 위해 라이브러리 tiktoken을 활용할 수 있는데, 책에서는 예시로 요청을 보내고 tiktoken을 통해 요청의 비용을 계산하는 과정이 소개되어 있다. GPT를 사용하기만 하고, 비용에 대해서는 고려하지 않았는데 응답 한번에 상당한 비용이 소모된다는 점을 배웠다.


 

프롬프트 엔지니어링을 위해, 복잡한 질문을 더 간단한 질문 여러 개로 분해하면 조정하기 편한 응답을 얻을 수 있다. 각 질문을 순서대로 하면서, LLM이 이전 답변을 기반으로 논리적인 순서로 정보를 탐색하도록 하는 것이다. 예를 들면, 단순히 당뇨병에 대해 설명을 요구하지 않고, 당뇨병에 대한 간단한 설명 - 종류 - 세분화된 증상 - 진단 방법 - 치료 방법 순으로 질문하게 되면 사용자가 원하는 핵심적인 답변을 얻을 수 있다.


 

또는 컨텍스트를 제공해서 LLM이 정확한 응답을 할 수 있도록 만드는 방법도 있다. LLM이 사용자의 요구사항을 잘 이해하도록 프롬프트에 추가정보를 제공하는 것이다. 이외에도 LLM의 성능과 비용을 최적화하는 다양한 기술들이 있으며, 책에서는 코드를 통해 예시를 직접 보여준다. 


 

LLM 서비스 구축에 관심 있는 사람이라면 꼭 읽어보아야 할 책이다. 이 책의 주제인 비용 최적화를 위해 모델을 선택하는 과정과, 모델을 배포할 때 드는 비용과 성능에서 고려할 사항들이 다음 장에 소개된다. 설명으로 끝나지 않고, 각각의 선택지를 선택했을 때의 장단점과 예시들이 그림이나 표로 이해하기 쉽게 정리되어 있어서 각각의 모델과 배포 방법을 선택하는데 큰 도움이 될 것이다.

#LLM #최적화 #비용최적화 #AI서비스구축 #인프라 #배포튜닝 #한빛미디어 #LLM서비스설계와최적화

 

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원 무료배송
닫기

리뷰쓰기

닫기
* 상품명 :
LLM 서비스 설계와 최적화
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
LLM 서비스 설계와 최적화
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
LLM 서비스 설계와 최적화
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?