머신러닝 모델을 사용하여 재미있는 어플리케이션을 제작하려고 한다. 문득 떠오른 아이디어인데, 프로젝트 수업에서 이 아이디어를 주제로 팀을 만들게 되었다. 기획한 어플리케이션은 모델이 설득력 있는 답변을 내는 것이 중요하여, ML-intensive application라고 할 수 있다. 아래 링크로 첨부한 Andrew Ng의 영상처럼, ML에서 data와 model(code)의 비중은 동등해지거나 data가 더 중요하게 다루어지기 때문에 데이터를 체계적으로 관리하고 싶었다. https://www.youtube.com/watch?v=TU6u_T-s68Y 특히, 1. 데이터 엔지니어링, 모델링을 맡은 팀원들이 동일한 데이터를 다루면 좋겠다. 2. git으로 code versioning을 하듯, data도 변화..
분류 전체보기
Chebyshev's Inequality는 통계에서 중요하게 다루어지는 부등식이다. 모든 분포(Distribution)에 적용이 되며, 이산적이든(discrete) 연속적이든(continuous) 증명이 가능하다. 특정한 사전이 일어나는 횟수인 확률 변수 X에 대해 |X-ɥ|≥kσ 또는 |X-ɥ|≺kσ 범위의 확률 값의 최대 또는 최솟값을 알 수 있다. Chebyshev's Inequality 외에도 더 정확하게 확률값을 근사할 수 있는 절대 부등식(항상 참이 되는 부등식)들이 존재한다.
March 1st marks Korean Independence Movement Day, a significant event in Korean history symbolizing the nation's struggle for freedom during the period of Japanese occupation. This non-violent movement holds immense importance as it saw participation from people of all ages, regions, and social backgrounds, united in their desire for Korean independence. The rallying cry of "Deahan-Doklip-Mansae..
2024 삼정 KPMG 아이디어톤에서 준준우승을 하였다. (65팀 중 3위) 회고 겸 후기 겸 정리를 하면 좋을 것 같아 글로 남긴다. 참여하게 된 계기는 우선, 작년에 사회 문제에 대한 시민의 의견을 모아 발의 법률안으로 작성하는 MEFETO를 함께 만들었던 C 후배의 제안으로 참가하게 되었다. 나머지 팀원인 PJ와 PS 모두 학생회 정보국 소속으로 잘 알고, 프로덕트에 대한 책임감도 강하다는 것을 알고 있었기에 대회 시작 전부터 너무 좋은 경험이 될 것이라 생각했다. 대회의 순서는 우선 서류 평가로 아이디어 기획서를 작성하고, 통과하면 실제 본선에서 LLM token과 GPU를 제공받아 프로토타입을 만들고 이를 발표하는 형식이었다. 주제가 ' 생성형 AI 모델을 활용한 기업업무 자동화 및 생산성 향상..
디지털 시대의 저널리즘과 과학 기사 글쓰기, 라는 과목명에는 두 가지 요소가 보인다. '디지털 시대의 저널리즘' 그리고 '과학 기사 글쓰기'이다. 방금 첫 수업을 마쳤는데, 수업 내용을 요약하고 과제에 대한 답을 작성하고자 한다. 1. Recap of the class content 1. essay vs. news 99.9% 확률로 우리는 졸업 후에, 에세이를 쓰지 않는다. 강의의 첫 번째 화두로, 에세이와 뉴스의 차이점을 들며 교수님은 우리 대학생들이 익혀야하는 것은 '뉴스 글쓰기'라고 주장하셨다. 두 글 종류의 차이는 에세이는 assertive하고 예상 독자가 specialist라는 점, 반면 뉴스는 informative하고 public을 예상 독자로 한다는 점이었다. 교수님의 정의가 매우 보편적이라..
확률과 통계 첫 시간이라 교수님께서 statistical article을 찾아오는 가벼운 과제를 주셨다. 1. Recap 수업 내에서 통계적 선포(proexclaim) 또는 statement에 대해, 여러 사례를 가지고, 아래의 네 가지 조건에 부합하는지 판단해보았다. 1. 올바른 질문인지 (right question) 2. 믿을 만한 출처의 통계 자료인지 (reliable source) 3. 표본(sample)이 모집단을 잘 반영하는지 (reflect) 4. 통계 자료를 기반으로 올바른 결론을 내렸는지 (appropriate conclusion) 그 중 한 가지 문제는 미국의 공화당(Republican)과 민주당(Democrat)의 지지율을 조사할 때 어떻게 표본을 추출할 것(sampling)인지 정하..
🔗 문제 링크 9465번: 스티커 💊 문제 요약 스티커가 2행 n열로 주어지며, 각 스티커에는 점수가 있다. 스티커를 한 장 떼었을 때 상하좌우의 스티커는 찢어져 못 쓰게된다. 이러한 조건에서 스티커의 떼었을 때 최대 점수를 알고 싶다. 테스트 케이스의 갯수 T가 주어지며, 각 테스트 케이스 별로 열의 갯수 n과 스티커의 점수가 2줄에 걸쳐 주어진다. 🌿 풀이 설명 처음에는 DFS를 통한 완전탐색으로 문제를 풀려고 했으나, 재귀함수 실행 시 int 매개변수 값이 자꾸 바뀌는 문제가 발생하여 코드가 오답을 뱉어냈다. 결국 정답 코드를 확인하고, DP 문제라는 것을 깨닫게 되었는데 기존에 DFS로 풀어야겠다고 결정하기 전에 DP를 고려하지 않았다는 것을 깨닫게 되었다. 이유는 직전에 풀었던 문제가 DFS 문..