| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 | 31 |
- 지표
- 구조 패턴
- terraform
- MAPF
- 토스
- AWS
- ssh
- AWS 비용 절감
- Rust
- github
- 논문 정리
- study
- leetcode
- 실용주의 프로그래머
- DevOps
- docker
- Til
- 경로 계획 알고리즘
- 티스토리챌린지
- 커머스
- 생성 패턴
- Go-lang
- 디자인 패턴
- 청첩장 모임
- 14일 공부
- Playwright
- 회고
- 오블완
- amazon ecs
- PostgreSQL
- Today
- Total
목록분류 전체보기 (328)
밤 늦게까지 여는 카페
안녕하세요. 5월인데 벌써 30도를 오가는 걸 보니 이번 여름도 무더위가 이어질 것 같습니다. 이번에는 토스에서 보낸 6개월, 9개월을 회고해보려고 합니다.적응기를 마치고 본격적으로 참여하면서 느꼈던 점과 배운 점을 정리해보겠습니다 :)1. 6개월 - 트래픽, 리소스 사용 패턴에 적응(이라 쓰고 버그)커머스 애즈 플랫폼 팀에서 일하면서 이전까지는 주로 셀러분들을 위한 기능 개발에 집중했었다면이 때부터 광고 서빙 업무에 본격적으로 참여하게 되었습니다. 이전에도 흥미롭다고 생각하여 페이싱에 관해서 공부하기도 하고Real Time Bidding(RTB)도 간단하게 공부해봤기에 정말 좋은 기회라고 생각했습니다. 막상 개발에 착수하니 수백만 명이 접속하는 기능을 수정해야 한다는 것이 엄청난 부담이 다가오더라고요...
안녕하세요. 2025년에 작성하려고 했던 페이싱 관련 글을 이제야 작성하게 되었습니다. 새로운 도메인, 업무, 그리고 문화에 적응하기까지 시간이 걸렸던 것 같습니다.작년 8월과 비교하면 정말 많은 것이 달라졌다고 느껴집니다.조만간 어떻게 지냈는지도 회고를 올려보려고 합니다...! 2026년도 벌써 5월이 되었는데 지금 그대로 에너지 유지할 수 있도록 힘내보겠습니다 :)1. 광고 입찰비가 계산되는 과정, Pacing이 왜 필요할까요? 이전 글에서 디지털 광고 과금 방식과 RTB(Real-Time Bidding) 를 간단히 훑으면서,각 광고 요청마다 DSP가 “입찰할까 말까, 한다면 얼마까지 쓸까?”를 실시간으로 결정한다는 이야기를 했습니다.이번 글에서는 입찰가를 어떻게 정하고를 다루는 Pacing을 정리해..
AI 서비스를 개발하실 생각이신가요? 어떤 것부터 알아봐야 할지 막막하셨다면 도움이 될 수 있을 것 같습니다. "머신러닝 시스템 설계" 로도 유명한 저자 칩 후옌이 2025년에 출간한 "AI 엔지니어링" '2장 파운데이션 모델 이해하기' 를 정리한 내용입니다.1. AI 모델 직접 학습시킬 것인가요?직접 학습시키시려구요...? 갈수록 언어 모델의 파라미터가 커지면서 필요한 학습 데이터의 양도 따라 늘어나고 있습니다. 최근 모델들은 사업적, 법적인 이유 등 다양한 이유로 학습 데이터의 크기를 밝히지 않고 있지만2020년에 공개된 GPT-3 모델만 하더라도 3000억(300B)개의 토큰이 학습에 사용되었습니다.참고: https://arxiv.org/pdf/2005.14165 더 이상 개인이 AI 모델을 학습시..
Q1. 언어 모델에서 말하는 token과 vocabulary는 뭐야? 실제 단어랑 어떻게 달라?A.Token은 모델이 실제로 처리하는 최소 단위Vocabulary는 모델이 인식할 수 있는 모든 토큰의 집합토큰은 우리가 말하는 "단어"와 1:1 대응하지 않습니다.예시문장: 나는 학교에 갔다단어 기준: ["나는", "학교에", "갔다"]토큰 기준: ["▁나", "는", "▁학교", "에", "▁갔", "다"]=> 토큰은 단어보다 작거나, 경우에 따라 더 큰 단위가 될 수도 있습니다.Q1.1. 모델이 학습하지 못한 이상한 단어를 쓰면 어떻게 돼?A.요즘 LLM은 서브워드 토큰화를 사용해서 그런 문제가 발생하지 않습니다.예시입력: 핫초코맛치킨토큰화: ["핫", "초코", "맛", "치킨"]=> 단어 전체를 몰라..
안녕하세요. 오늘은 코드 컨벤션, 구조를 테스트할 수 있는 도구인 ArchUnit과 Konsist에 대해 공부한 내용을 정리해보려고 합니다.1. ArchUnit1.1. ArchUnit이란?ArchUnit은 Java 및 Kotlin 코드베이스의 아키텍처 규칙을 테스트하기 위한 정적 분석 라이브러리입니다.Java 바이트코드를 분석해서패키지 의존성레이어 구조클래스/메서드 명명 규치4등 다양한 아키텍처 제약사항을 코드로 표현하고 테스트할 수 있습니다.그래서 "Arch"Unit 인 것 같습니다!Kotlin도 지원하므로, JVM 기반 프로젝트 전반에 적용할 수 있습니다.1.2. ArchUnit이 Java 바이트코드를 분석하는 방법그렇다면 ArchUnit은 Java 바이트코드를 어떻게 분석할까요?ArchUnit은 i..
안녕하세요. 회사에서 AI 엔지니어링 스터디를 진행하게 되었는데 제가 공부한 내용들을 정리하고자 합니다.Effective context engineering for AI agents블로그 글을 읽으면서 떠올랐던 질문들을 정리해서 1. Context(컨텍스트)가 뭐에요?Anthropic 블로그에서는 컨텍스트를 다음과 같이 설명합니다.Context refers to the set of tokens included when sampling from a large-language model (LLM) 컨텍스트란 LLM이 답변을 생성할 때 입력으로 함께 넣어주는 토큰들의 집합이라고 하네요. chatGPT, Gemini, Claude 등 LLM의 입력으로 전달되는 토큰들이라고 하면 다양한 값들이 있습니다.시스템 프..