Machine Learning (11) 썸네일형 리스트형 2024년에 한 생각과 2025년에 할 생각, 머신러닝 엔지니어는 어디로 가야 하는가? 커리어에 관한 생각이 매우 많았어서 24년이 끝난것을 기념해 짧게 정리를 해 보았습니다. 24년에 가장 오래 그리고 깊게 고민했던 질문은 다음과 같다.머신러닝 엔지니어의 커리어 방향에는 머신러닝과 엔지니어링 중에서 어떤것을 중점으로 해야 하는가? 머신러닝에 속하는 업무 영역- 알고리즘과 모델 개발- 데이터 분석- 이 영역은 머신러닝 리서치를 하시는 분, 데이터 사이언티스트 분들과 겹칠 수 있습니다. 엔지니어링에 속하는 업무 영역- 머신러닝 운용에 요구되는 백앤드 서버 개발- 피쳐 및 학습데이터를 위한 데이터 엔지니어링- 서버 개발에 필요한 소프트웨어 인프라- 이 영역은 백엔드 개발자, 데이터 엔지니어분들과 겹칠 수 있습니다. 실제 업무 비중 (주의, 이는 회사마다, 팀 마다 매우 다릅니다.)- 머신러닝 .. Self-Attentive Sequential Recommendation 논문 리뷰 사용자의 문맥을 활용한 추천 모델 중 하나인 SASRec: Self-Attentive Sequential Recommendation을 정리해 보았습니다. 사용자의 문맥을 활용한, Sequential Recommendation 추천 리서치를 진행했으며, 아래 3개의 주요한 시퀀셜 추천 논문을 3가지를 비교해 보았습니다 (with LLM).SASRec: Self-Attentive Sequential RecommendationBERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from TransformerGRU4Rec: Session-based Recommendations with Recurrent Neural Netwo.. DeepTrax: 트랜잭션 데이터 임베딩 구현 및 시각화 해보기 https://arxiv.org/pdf/1907.07225DeepTrax: embedding graphs of financial transactions 논문을 훑어고금융 거래 데이터를 활용하여, 거래 항목을 임베딩 후, 임베딩 결과를 시각화 해 보았습니다. DeepTrax: embedding graphs of financial transactions1. INTRODUCTION금융 거래 이종 그래프(heterogeneous graph)로 표현하고, 이들간의 거래를 edge로 표현하는것은 유용한 접근법이 될 수 있지만, 이러한 그래프는 매우 높은 차원을 가지고, 희소하게 연결되어 있어 일반적인 머신러닝 작업에 활용하기 어렵습니다.최근 몇년 동안(논문 출판 년도 : 2019년) 이러한 그래프의 latent r.. Tool-integrated Reasoning (TIR) 소개 LLM을 통해서 수학 문제를 풀어보기 위해서 Qwen2.5-Math-7B-Instruct 모델을 사용하려 했습니다.https://huggingface.co/Qwen/Qwen2.5-Math-7B-Instruct Qwen/Qwen2.5-Math-7B-Instruct · Hugging FaceQwen2.5-Math-7B-Instruct 🚨 Qwen2.5-Math mainly supports solving English and Chinese math problems through CoT and TIR. We do not recommend using this series of models for other tasks. Introduction In August 2024, we released the first s.. Feast : 머신 러닝을 위한 오픈 소스 피쳐 스토어 https://github.com/feast-dev/feast?tab=readme-ov-file GitHub - feast-dev/feast: The Open Source Feature Store for Machine LearningThe Open Source Feature Store for Machine Learning - feast-dev/feastgithub.com 일반적으로 머신 러닝에서 피쳐는 두번 사용됩니다. 첫 번째는 모델 학습을 진행할 때, 두 번째는 학습된 모델을 사용하여 추론할 때입니다. 학습단계에서는 대용량의 피쳐 데이터를 생성하여 모델이 특정 패턴을 학습 할 수 있도록 합니다. 추론 단계에서는 피쳐데이터를 즉각적인 추론 결과를 제공할 필요가 있습니다. 또 이 두 피쳐가 달라지게 되.. tensorflow recommenders는 어떻게 listwise ranking을 구현했을까? * 이 글은 다음의 문서를 읽고 한번 더 해석을 해본 글 입니다.* tensorflow recommenders 를 TFRS라고 하겠습니다.https://www.tensorflow.org/recommenders/examples/listwise_ranking?hl=ko 목록별 순위 | TensorFlow Recommenders이 페이지는 Cloud Translation API를 통해 번역되었습니다. 목록별 순위 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요. 에서 기본 순위 튜토리얼 , 우리는 사용자www.tensorflow.org TFRS 에서의 pointwise, pairwise, listwise 구현1. 학습데이터 준비listwise의 경우 하나의 학습 데이터 마.. Tensorflow recommenders 튜토리얼 후기 서두가 매우 길어서, 급하신 분은 텐서플로우 recommenders 소개 항목 부터 보시는것을 추천드립니다.Tensorflow recommenders 사용 배경 랭킹 모델을 생각했을때 가장 쉬운 접근 방법은, 사용자와 아이템 정보를 활용하여 0 / 1 (사용자가 싫어함 / 좋아함) 을 기준으로 binary classificaion 을 해볼 수 있습니다.이것을 pointwise ranking model 이라고 할 수 있습니다.user_iditem_idfeature_1feature_2group_id (optional)label11xxxxx1012yyyyy1113zzzzz10 위의 데이터 구조처럼 깔끔한 정형 데이터를 사용할 수 있고, 학습 및 추론 속도가 빠르다는 장점이 있습니다. 그러나 아이템 간 상대적인.. 추천 시스템 캐글 대회 후기 (OTTO – Multi-Objective Recommender System) https://www.kaggle.com/competitions/otto-recommender-system OTTO – Multi-Objective Recommender System | Kaggle www.kaggle.com처음으로 캐글이란 것을 해 보았고, 후기를 작성했습니다.한번 시작하고 나니 생각 이상으로 몰입되었으며, 앞으로 한동안은 캐글과 같은 데이터 경진대회를 시도할 것 같습니다! OTTO - Multi-Objective Recommender System Competitione-commerce 의 클릭, 카트 담기, 주문을 예측하는 대회학습, 테스트 데이터는 세션 id에 따른 event {"aid": 아이템 아이디, "ts" : 시간(unixtime), "type": 타입(clicks, ca.. 이전 1 2 다음