ansir 님의 블로그

SK 네트웍스 family AI 캠프 9주차 회고( 2025-04-21 ~ 2025-04-25 ) 본문

SK 네트웍스 family AI 캠프/주간 회고

SK 네트웍스 family AI 캠프 9주차 회고( 2025-04-21 ~ 2025-04-25 )

ansir 2025. 4. 30. 09:05


 

주간 수업 내용 복습

 

[ SK 네트웍스 Family AI 캠프 수업 내용 복습 ] 자연어 처리 기법 2025-04-22

자연어 처리 순서1. 데이터 수집분석 목적에 맞는 텍스트 데이터를 수집하는 단계예: 뉴스 기사, SNS 댓글, 리뷰, 고객 문의, 논문 등웹 크롤링, API, 공개 데이터셋 등을 활용할 수 있다.예: Kaggle, Hu

ansir.tistory.com

 

[ SK 네트웍스 Family AI 캠프 수업 내용 복습 ] 자연어 임베딩 이해 2025-04-24

1. 임베딩의 개념과 필요성문자를 단순히 숫자로 매핑 dog=1 cat=2 human=3 king=4 queen=5단어들간의 의미를 반영 못함dog, puppy -- 비슷한 숫자표현( 벡터 )one-hot-encoding: 각 단어를 고유한 이진 벡터로 표현

ansir.tistory.com

 

[ SK 네트웍스 Family AI 캠프 수업 내용 복습 ] 자연어 딥러닝 기초 2025-04-25

시퀀스 데이터와 임베딩 벡터시퀀스 데이터: 순서가 중요한 데이터시계열: 시간에 따라서 변하는 데이터텍스트: 단어 순서가 의미를 결정임베딩 벡터의 필요성고정된 길이의 숫자 배열비슷한

ansir.tistory.com


The four Fs

FACTS(사실, 객관): 이번 일주일 동안 있었던 일, 내가 한 일

이번주는 자연어를 처리하기 위해 데이터( 문장 )을 가공하는 방법에 대해 배웠습니다.

문장을 숫자로 변환하고 그것을 벡터로 변환하는 임베딩에 대해 배웠으며, 그 방식은 Word2Vec (CBOW, Skip‑gram), GloVe, FastText, Transformer 기반 (BERT, RoBERTa 등)이 있습니다.

임베딩 이후에는 문장이 벡터로 변환이 되며, 이것을 문맥을 고려한 벡터로 변환해주는 과정이 필요합니다. 이를 LSTM에 넣어 벡터를 순서대로 처리하고 문장의 의미 요약해서 전체 문장의 정보를 담은 벡터를 받을 수 있습니다.

FEELINGS(느낌, 주관): 나의 감정적인 반응, 느낌

머신러닝, 딥러닝을 거쳐 점점 제가 알고 있는 Chat GPT와 같은 LLM에 도달하고 있는 듯한 느낌이 듭니다. 처음 배울 때 막막했던 것들이 조금씩 눈에 들어오니 좀 더 해보고 싶은 것들이 명확해지는 것 같습니다.

문장을 숫자로 변환하고 그것을 벡터로 변환하는 과정이 익숙하지 않다보니 잘 이해가 되지 않을 때가 많습니다. 점점 더 내용이 어려워 지지만 어느 순간 한 부분이 이해되면 다른 이해되지 않는 부분도 깨달을 때가 많아서 공부하는 재미는 있는 것 같습니다.

FINDINGS(배운 것): 그 상황으로부터 내가 배운 것, 얻은 것

요즘 하루하루 배운 내용들을 바로바로 블로그에 정리해서 포스팅하고 있는데 도움이 되는 것 같습니다. 수업 시간에 정말 많은 내용을 배우는데 그것을 정리하고 보면 결국엔 한 가지 목표를 위해 사용할 수 있는 여러 방법을 배우는 것이라는 것을 알 수 있었습니다.

이번 주 수업을 예로 들자면 문장을 컴퓨터가 이해할 수 있게 숫자로, 벡터로 변환한다는 목표에서 벡터로 변환하는 임베딩 방법이 Word2Vec (CBOW, Skip‑gram), GloVe, FastText, Transformer 기반 BERT와 같은 다양한 방법이 있다는 것을 배운 것입니다. 결국 무엇을 하는 것인지( 목표 )를 알게 되면 어떤 방법을 사용할 것인지는 스스로 정하면 되기 때문에 너무 복잡하게 생각하지 않게 되고 이것이 공부를 할 때 마음을 편하게 해주는 것 같습니다.

FUTURE(미래): 배운 것을 미래에는 어떻게 적용할 지

앞으로 있을 3번째 프로젝트는 자연어 딥러닝을 이용한 프로젝트 입니다. 지금 공부한 내용을 잘 습득하여 좋은 결과를 얻을 수 있으면 좋겠습니다. 프로젝트 이외에도 자연어 문장을 생산하는 것에도 관심이 많기 때문에 개인적인 프로젝트( 게임 시나리오 작성 등 )을 진행해보고 싶습니다.

반응형