| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
- ssh
- docker
- leetcode
- 오블완
- Til
- 디자인 패턴
- 구조 패턴
- 14일 공부
- Rust
- 커머스
- 지표
- DevOps
- AWS 비용 절감
- 애즈
- 티스토리챌린지
- terraform
- 논문 정리
- 신혼 여행
- PostgreSQL
- 실용주의 프로그래머
- github
- 경로 계획 알고리즘
- MAPF
- study
- 생성 패턴
- 청첩장 모임
- AWS
- Playwright
- Go-lang
- amazon ecs
- Today
- Total
목록For Fun (66)
밤 늦게까지 여는 카페
AI 서비스를 개발하실 생각이신가요? 어떤 것부터 알아봐야 할지 막막하셨다면 도움이 될 수 있을 것 같습니다. "머신러닝 시스템 설계" 로도 유명한 저자 칩 후옌이 2025년에 출간한 "AI 엔지니어링" '2장 파운데이션 모델 이해하기' 를 정리한 내용입니다.1. AI 모델 직접 학습시킬 것인가요?직접 학습시키시려구요...? 갈수록 언어 모델의 파라미터가 커지면서 필요한 학습 데이터의 양도 따라 늘어나고 있습니다. 최근 모델들은 사업적, 법적인 이유 등 다양한 이유로 학습 데이터의 크기를 밝히지 않고 있지만2020년에 공개된 GPT-3 모델만 하더라도 3000억(300B)개의 토큰이 학습에 사용되었습니다.참고: https://arxiv.org/pdf/2005.14165 더 이상 개인이 AI 모델을 학습시..
Q1. 언어 모델에서 말하는 token과 vocabulary는 뭐야? 실제 단어랑 어떻게 달라?A.Token은 모델이 실제로 처리하는 최소 단위Vocabulary는 모델이 인식할 수 있는 모든 토큰의 집합토큰은 우리가 말하는 "단어"와 1:1 대응하지 않습니다.예시문장: 나는 학교에 갔다단어 기준: ["나는", "학교에", "갔다"]토큰 기준: ["▁나", "는", "▁학교", "에", "▁갔", "다"]=> 토큰은 단어보다 작거나, 경우에 따라 더 큰 단위가 될 수도 있습니다.Q1.1. 모델이 학습하지 못한 이상한 단어를 쓰면 어떻게 돼?A.요즘 LLM은 서브워드 토큰화를 사용해서 그런 문제가 발생하지 않습니다.예시입력: 핫초코맛치킨토큰화: ["핫", "초코", "맛", "치킨"]=> 단어 전체를 몰라..
안녕하세요. 오늘은 코드 컨벤션, 구조를 테스트할 수 있는 도구인 ArchUnit과 Konsist에 대해 공부한 내용을 정리해보려고 합니다.1. ArchUnit1.1. ArchUnit이란?ArchUnit은 Java 및 Kotlin 코드베이스의 아키텍처 규칙을 테스트하기 위한 정적 분석 라이브러리입니다.Java 바이트코드를 분석해서패키지 의존성레이어 구조클래스/메서드 명명 규치4등 다양한 아키텍처 제약사항을 코드로 표현하고 테스트할 수 있습니다.그래서 "Arch"Unit 인 것 같습니다!Kotlin도 지원하므로, JVM 기반 프로젝트 전반에 적용할 수 있습니다.1.2. ArchUnit이 Java 바이트코드를 분석하는 방법그렇다면 ArchUnit은 Java 바이트코드를 어떻게 분석할까요?ArchUnit은 i..
안녕하세요. 회사에서 AI 엔지니어링 스터디를 진행하게 되었는데 제가 공부한 내용들을 정리하고자 합니다.Effective context engineering for AI agents블로그 글을 읽으면서 떠올랐던 질문들을 정리해서 1. Context(컨텍스트)가 뭐에요?Anthropic 블로그에서는 컨텍스트를 다음과 같이 설명합니다.Context refers to the set of tokens included when sampling from a large-language model (LLM) 컨텍스트란 LLM이 답변을 생성할 때 입력으로 함께 넣어주는 토큰들의 집합이라고 하네요. chatGPT, Gemini, Claude 등 LLM의 입력으로 전달되는 토큰들이라고 하면 다양한 값들이 있습니다.시스템 프..
검색 엔진이 어떻게 동작하는지 아주 간단하게 공부해봤습니다.ElasticSearch를 이용해서 기능을 개발하면서 개인적으로 흥미가 생겨 공부하게 되었습니다.0. 공부할 자료Introduction to Information Retrieval https://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf스탠포드 대학교에서 만든 정보 검색 분야의 유명한 교과서입니다정보 검색 분야에서 자주 나오는 용어- Term: 문서 안에 나오는 단어(토큰)- Document: 검색 대상이 되는 하나의 문서(게시글, 뉴스 글 등)- Collection, Corpus: 검색 대상이 되는 문서의 전체 집합- Information need: 사용자가 진정으로 찾고 싶어하는 정보- qu..
안녕하세요. 시간이 정신 없이 흐르네요 ㄷㄷㄷ어느새 추석이 끝났고 날씨도 쌀쌀해지고 있습니다.거의 2달?만에 저번에 말씀드렸던 페이지 관련 용어들을 정리하게 되네요. 1. 탐색/발견 단계- 홈 페이지(Home): 브랜드 핵심 메시지, 프로모션, 신상품·추천 컬렉션으로 첫 인상과 진입 동선을 만든다.- 랜딩 페이지(Landing): 광고·SNS·검색에서 유입되는 목표 지향 페이지로 단일 목표 전환(구독/구매/리드)에 최적화한다. - 카테고리 페이지(Category): 상위 분류(예: 남성/여성/전자/리빙) 허브로 하위 PLP로의 내비게이션을 제공한다. - 브랜드 페이지(Brand): 특정 브랜드 스토리, 베스트/신상품, 컬렉션을 모아 브랜딩과 탐색을 돕는다.- 기획전/프로모션 페이지(Promotion/..