상위 토픽으로 모아진 뉴스 기사, 그리고 기타 정보를 담은 글을, 하위 토픽별로 재분류하는 연구를 진행하며 대량의 문서 데이터 내에서 unsupervised하게 토픽을 추출하고 동시에 클러스터링까지 진행하는 것을 Clustering Topic Modeling이라고 한다. 1. Topic Modeling의 한계 그런데, 특히 뉴스와 같이 사건을 다룬 글들을 클러스터링하는 과정에서 기존 Topic Modeling만으로는 한계를 가지고 있다. 현재 Benchmark로 삼고 있는 Top2Vec의 경우를 살펴보면, https://github.com/ddangelov/Top2Vec GitHub - ddangelov/Top2Vec: Top2Vec learns jointly embedded topic, document..
전체 글
대량의 텍스트 데이터를 클러스터링하는 연구를 하고 있다. 기존에는 K-means로, 가지고 있는 컴퓨팅 자원이 많지 않아 가장 가벼운 알고리즘을 사용하다가 HDBSCAN을 접하고 괜찮다고 생각하여 비교하는 글을 작성한다. 1. 정의 K-means: https://ko.wikipedia.org/wiki/K-%ED%8F%89%EA%B7%A0_%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98 k-평균 알고리즘 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. k-평균 알고리즘(K-means clustering algorithm)은 주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작 ko.wikipedia.org K..
원래 프로그래밍부터 디자인까지 다양한 제품 개발 과정에 있어 토스의 사례를 보고 많이 배우는 편이다. 그렇게 타고 타면서 보다가, 정말 인상적으로 본 세션이 있어 글로 정리한다. 제품 개발에서 쉽게 간과할 수 있는 부분이 뇌피셜 개발이다. 사용자의 불편함을 의미하는 객관적인 지표나 관찰 결과에 기반하지 않고, 스스로의 생각에 너무 빠져서 모든 걸 개발해나가는 것이다. 내가 사용자라고 가정하고 불편했던 것을 적절하게 반영하는 것이 아니라 지나치게 몰두했을 때, 결국 실제 필요하지 않은 제품을 개발하는 결과를 낳게 되기도 한다. 본 세션은 토스의 Internal Product Designer, 현재는 부서의 이름이 바뀌었지만 토스의 사내툴을 개선하는 업무를 맡고 있는 오지은 디자이너, 한지연 CX 리더분께서..
법률과 정치 데이터를 연구하며, 이를 비즈니스 모델로 발전시키기 위해 국회의원 분들이나 정치계 종사자 분들과 면담을 그제부터 진행하였다. 오늘 광주의 양향자 국회의원님과 면담할 수 있었는데, 의원님의 인생사에 대해 미리 알아가기도 하고, 실제로 대화를 나누면서 정말 궁금한 점이 생겼다. 상고 출신의 사무 직원에서, 이공계 연구원으로, 임원진으로, 그리고 국회의원까지 대단하신데... 결혼과 출산, 육아까지 동시에 어떻게 하신거지? 준비했던 질문 내용을 끝내놓고, 직접적으로 위의 질문을 의원님께 던졌다. 면담을 하며 본인의 자서전과, 대한민국 국가 전략에 대해 쓰신 책을 두 권 주셨는데 자서전에 내용이 있으니 잘 읽어보라고 하셨다. 자서전: https://www.yes24.com/Product/Goods/5..
이맘쯤 가을에 접어들면, 차 타고 갈 때 붕어빵 집이 하나둘 보이기 시작한다. 차 타고 가면서 구입하기는 정말 힘든데, 붕어빵 드라이브스루 시스템이 있으면 어떨까 생각하던 와중, 예전에 붕어빵 정보 공유 어플리케이션이 있다는 것을 본 기억이 났다. 구글 플레이스토어에 검색해보니, 아직 있다. 앱 소개 이미지도 깔끔하고, 앱 디자인이나 무엇이나 잘 만든 앱인 것이 느껴졌다. 디프만이라는 디자이너 & 개발자 동아리에서 처음 만들어졌다고 하는데, 대학생스러운 독특한 아이디어와 제품 컨셉이 정말 마음에 들었다. 최근 어플리케이션을 제작하며, 유저 시나리오를 바탕으로 UX를 설계하는 것이 고민이다. 디자인을 둘째로 하더라도 기본적인 앱의 구조는 사실 기획자의 영역이라고 생각한다. 특히 현재 팀처럼 개발에 항상 목..
이 포스트는 Attention Mechanism뿐만 아니라 그 전의 기본적인 요소에 대해서도 헷갈리는 분들을 위해 작성되었습니다. "Attention is All You Need"는 Transformer 아키텍처를 처음 제시한 논문인데요. 본 아키텍처 내의 기본적인 요소부터 다소 과하게 정리할 것이기 때문에 대략 3개의 포스팅 연재를 통해 이를 설명하고자 합니다. Attention Is All You Need The dominant sequence transduction models are based on complex recurrent or convolutional neural networks in an encoder-decoder configuration. The best performing mode..
논문의 개요 - 지난 글 참고 [CVPR 22'] Dressing in the Wild by Watching Dance Video - 1 https://arxiv.org/abs/2203.15320 Dressing in the Wild by Watching Dance Videos While significant progress has been made in garment transfer, one of the most applicable directions of human-centric image generation, existing works overlook the in-the-wild im inseon.tistory.com 1. Conditional Person Segmentation 기존의 pose t..
https://arxiv.org/abs/2203.15320 Dressing in the Wild by Watching Dance Videos While significant progress has been made in garment transfer, one of the most applicable directions of human-centric image generation, existing works overlook the in-the-wild imagery, presenting severe garment-person misalignment as well as noticeable degr arxiv.org Dressing in the Wild by Watching Dance Video는 틱톡을 서비..