전체 글

위의 제목은 사실 본인에게 하는 말이다 😅 이 글에서는 Python에서 queue 구현 시, 반드시 collections.deque를 사용해야하는 구조적인 이유와 더불어, 왜 코드 구현 시에 '코드에 사용하는 코드의 구조'까지 찾아 정리하게 되었는지에 대한 사설이 포함되어 있다. [사설] 이 글과 같은 고민이 중요하다고 느끼게 된 계기 1. list로 queue를 구현한 자의 최후 프로그래머스 2022 KAKAO TECH INTERNSHIP 두 큐 합 같게 만들기 문제에서 런타임 에러+메모리 초과로 문제를 해결하지 못한 적 있었다. (2023.11.10) 학교 선배가 보고, collection.deque를 쓰세요라는 말을 해주셨는데 '아, deque 뭐 그거 파이썬에서 list 대신 쓰는 빠른 자료형이 ..
문제 링크 12489번: 본대 산책 문제 요약 학교 지도가 그래프로 주어진다. 정보과학관에서 출발해 산책한 후 D분 후, 정보과학관으로 돌아오는 산책 경로의 수를 구한다. 단, 산책을 하며 건물에 머무르는 경우는 없고, 각 건물 간 이동 시간은 1분이다. 풀이 설명 백준에 나와있는 이 문제의 알고리즘 유형은 DP와 그래프 이론이었다. 처음 문제를 받고 15분 정도 하다가 감을 잘 못 잡는 것 같아서 알고리즘 유형을 봤다. 내가 이해하고 있는 DP는 이전의 계산값을 사용하여 다음 계산값을 구하는 것, 그래프 이론은 그래프 사용하는 것(?) 학교의 '그래프 이론' 수업을 들어야겠다는 생각이 든다...😅 지금 글 쓰면서 찾은 건데, 파이썬 그래프 구현 방법이 내가 한 방법과 같다..!! 나의 풀이 def po..
안녕하세요 글을 읽으시는 모든 분들 반갑습니다! 저는 메페토의 리더를 맡으며, 기획, 리서치, Python 개발과 같이 여러 업무를 맡고 있는 황인선이라고 합니다. 이 글은 메페토가 2023년 4월부터 지금까지 여러 도전을 거치며 조사했던 정치에 대해 여러분께 소상히 밝히기 위해 작성되었습니다. * XX 101이란, XX 분야에 대한 개론이자 가장 기초적으로 알고 있어야 하는 내용을 설명하는 수업이나 글을 의미합니다. 대부분 정치에 관심이 없거나, 나아가 싫어하는 분들이 이 글을 읽으시리라 생각하면서, 어떤 내용을 담아야 가장 많이 얻어가실 수 있을지 고민했습니다. 저도 현재 우리나라 정치 양상이 마음에 안 드는 부분도 많고, 또 부정적인 모습만 보이는 것도 사실이거든요. 저도 기존 이 당은 우리편, 저..
수강 계기 🛫 최근 스스로 되돌아보았을 때, 논문 이해하기 / 인공지능 수학적 원리 이해하기 / 코드 빠르게 익혀서 사용하기 이런 능력을 기른 반면, 인공지능의 기초가 부족하다는 생각이 많이 들었다. 항아리를 크고 멋지게 만들더라도, 아래에 작은 구멍 하나가 있으면 물이 새듯이 기초에 대한 부족함을 많이 느꼈다. 이를 보완하기 위해 Kaggle의 competition, learning을 통해 지속적으로 공부하기로 마음 먹었다. Kaggle 강의 후기 🏁 위와 같이 학습 코스는 설명 부분인 Tutorial과 실습 부분인 Exercise로 구성되어 있는데, 학습 코스의 주제를 설명하기 위한 스토리텔링이 잘 갖추어져 있어 이해하기에 좋았고 다른 사람에게 배운 것을 설명할 때에도 매우 유용한 아이디어를 많이 배..
유튜브나 틱톡과 같은 영상 스트리밍 서비스에서 익명성을 유지하면서 컨텐츠를 제작하고 싶어하는 사람들이 많아질 것이라고 보인다. 유튜브 채널 분석 플랫폼 플레이보드에 따르면, 우리나라의 수익창출 유튜버는 30만명 이상 그 중 구독자 1만 이상의 유튜버는 6만 명 이상으로 점점 영상 중심 플랫폼과 영상 제작의 접근성 향상으로 이러한 수치는 증가할 것이라 생각된다. 그런 중에, 함께 생기는 산업 분야 중 하나가 '버튜버 아바타 스트리밍 서비스'이다. 버튜버란, 실제 얼굴이 아니라 가상의 아바타를 앞에 세우고 방송을 하는 유튜버를 말한다. 이것이 아이돌이나 여캠/남캠과 같은 유형의 방송에 쓰이기도 하고, 해설이나 정보 설명과 같은 영상에도 사용되기도 한다. 버튜버 아바타 서비스의 핵심 사실, 버튜버 아바타 사업..
최근 몇 주간 DATA AI 분석 경진대회 마무리를 위해 프로그래밍에 집중하였다. 학교 시험 기간 전까지, 인공지능보다는 어떤 제품을 만들지 어떤 고객에 도움이 될지 개발 외적인 고민만 하다 발등에 불이 떨어지고, 계획은 많은 상태에서 완성을 목표로 열심이였다. 대회 기간 동안, 인공지능 모델 개발과 자연어 처리 두 분야 모두에 공백이 너무나 많은 스스로를 발견했다. 그 공백들을 채우면서도 아이디어들을 시도하고 만들어가는 과정을 시험 2주 전부터는 대부분 혼자하게되어 조금 많이 버거운 순간들도 있었다. 무엇을 얻었나? 대회 기간 동안, 내가 작성한 코드와 지식들도 있겠지만 아래의 두 가지를 크게 얻게 되었다고 생각한다. 책임감 내가 정말 관심있는 것이 무엇인지 발견 첫 번째로, 책임감을 배울 수 있었다...
상위 토픽으로 모아진 뉴스 기사, 그리고 기타 정보를 담은 글을, 하위 토픽별로 재분류하는 연구를 진행하며 대량의 문서 데이터 내에서 unsupervised하게 토픽을 추출하고 동시에 클러스터링까지 진행하는 것을 Clustering Topic Modeling이라고 한다. 1. Topic Modeling의 한계 그런데, 특히 뉴스와 같이 사건을 다룬 글들을 클러스터링하는 과정에서 기존 Topic Modeling만으로는 한계를 가지고 있다. 현재 Benchmark로 삼고 있는 Top2Vec의 경우를 살펴보면, https://github.com/ddangelov/Top2Vec GitHub - ddangelov/Top2Vec: Top2Vec learns jointly embedded topic, document..
대량의 텍스트 데이터를 클러스터링하는 연구를 하고 있다. 기존에는 K-means로, 가지고 있는 컴퓨팅 자원이 많지 않아 가장 가벼운 알고리즘을 사용하다가 HDBSCAN을 접하고 괜찮다고 생각하여 비교하는 글을 작성한다. 1. 정의 K-means: https://ko.wikipedia.org/wiki/K-%ED%8F%89%EA%B7%A0_%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98 k-평균 알고리즘 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. k-평균 알고리즘(K-means clustering algorithm)은 주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작 ko.wikipedia.org K..
inthree3
황인선