기타

자연어 처리 강의 특강

이게될까 2024. 4. 29. 14:46
728x90
728x90

데이터 엔지니어 - 데이터를 관리하는 사람들 == 쿼리 잘짜기, 데이터에 대한 지식

데이터 사이언티스트 == 이론적 지식, 실험 설계를 잘 해야 한다. -> 경험이 중요! 성능 올리기 위해 고민하기 

생성형 AI - ML이 할 수 있는 일 중 하나이다. 다양한 분야에서 할 수 있다. 

시리즈 C,D 스타트업들은 중견, 대기업보다 대우가 좋은 곳이 있다.

모델링은 여러번 경험하는데 서빙으로 올려본 사람이 많이 없다. - 텐서플로우, 파이토치, 블로그 등등 많이 있다. 
서빙을 해보자 - 모델의 입력 설계, 추론 속도에 대한 고민을 하게 된다.

RAG - 적합한 문서를 찾아서 답변에 사용 

ML분야는 전부 스터디가 있다. 개인적으로도 논문, 다양한 분야 스터디를 진행한다.

면접 : 배경지식, 코딩은 다다익선, 커뮤니케이션 능력이 중요하다. - 모르면 모른다고 말하기 

체험형 인턴도 추천! - 채용으로 이어지지 않으나 일을 잘하면 어떻게든 뽑는다.
팀 구성이 어떻게 되는지 봐라 -> 1,2년 차 밖에 없으면 배울게 없다. 리더급, 팀장이 있는 것이 중요
이름있는 첫 회사가 중요한게 이 이유도 된다.

코딩 공부하는 방식 - 정하고 만들어 보기 == 만드는 과정 자체가 공부이다.

TFX - 문서가 잘 되어 있어서 파이프 라인의 감을 잘 잡을 수 있다. 

https://www.tensorflow.org/tfx?hl=ko

 

TFX | ML 프로덕션 파이프라인  |  TensorFlow

엔드 투 엔드 프로덕션 ML 파이프라인을 빌드하고 관리합니다. TFX 구성요소가 확장 가능한 고성능 데이터 처리, 모델 학습 및 배포를 지원합니다.

www.tensorflow.org

쳇 봇은 렝 체인이 필수다. 

GPT를 통해 데이터를 증강시킬 순 있는데 없는 데이터를 만들지는 않는다.

쿠버네티스 - 협업에서는 이러한 환경에서 진행한다. 중요!
경험이 중요하다.

텐서플로우 서빙, 벤토ML, 온해....? 를 많이 사용

 

728x90