티스토리 뷰
1107회 로또 당첨 번호가 2024-02-16-토 발표되었습니다. 그리고 로또 당첨 번호를 분석해 봐야겠다는 작은 생각이 들었습니다. 누구나 한 번쯤 그런 생각을 해봅니다. 로또 번호 예측해볼 수는 없을까?
※금번 발표된 로또 당첨 번호가 궁금하신 분들은 아래 확인하기 바랍니다.
인생을 살면서 나에게 오는 행운을 마냥 기다리는 것도 좋지만, 지푸라기라도 잡는 심정으로 보다 계획적으로 접근해 보면 어떨까 하는 생각에서 1107회까지의 로또 예상 번호를 분석해보고, 1108회 로또 번호를 감히 예상해보고자 합니다.
1107회 로또 당첨 번호 조회
1107회 로또 당첨번호까지 추가되어 1회차부터 현재까지의 번호별 통계가 업데이트되었습니다. 자세한 정보는 온라인 동행복권 홈페이지에서 확인하실 수 있습니다.
여기서는 분석을 위해 각 번호별 통계량 데이터만을 이용합니다. 1회 차 ~ 1107회 차 번호별 통계는 위 바로가기 정보를 확인해 보시기 바랍니다.
✅분석의 [대전제]
- 수학적 확률과 실질 사이에는 간극이 있고, 실질은 수학적 통계치(평균)로 수렴할 것이다.
- 전체가 [전제 1]과 같은 경향을 가진다면 부분도 동일한 경향을 가질 것이다.(프랙털)
- 그럼에도 불구하고 이론과 실제는 다르므로 우연에 의한 오차를 인정할 것이다.
개인적으로 로또 당첨번호 분석의 전제로 삼은 3가지는 위와 같습니다. 하나씩 천천히 설명드리면 수학적 통계란 흔히 이론적으로 '그럴 것이다' 여겨지는 결과가 나올 것이라는 믿음입니다.
전제 1) 수학적 확률로 수렴할 것
예를 들면 주사위는 총 1부터 6까지의 눈을 가지고 있습니다. 한번 던질 때 주사위의 형질상 특이점이 없다면 특정한 숫자 등장할 확률은 1/6 이겠지요. 이 1/6의 확률은 이론적인 수치이죠. 실제로는 주사위를 6번 던진다면 1부터 6까지가 한 번씩 등장할 수도 있겠지만, 아닐 경우가 더 많을 것입니다. 연속으로 특정한 숫자가 나올 수도 있는 노릇이고 말입니다.
이렇게 실제와 이론에는 차이가 있습니다만, 주사위를 던지는 실험을 무한히 반복한다면 1부터 6까지의 숫자는 비교적 고른 분포를 띠며, 전체 시행 횟수 대비 각 숫자의 출현 빈도는 1/6이라는 수학적 확률에 수렴할 것이라는 사실만은 분명합니다.
그렇다면 이를 로또 번호 45개에 대입해도 동일한 결론을 낼 수 있지 않을까요? 1부터 45까지의 숫자가 횟차가 늘어날수록 저 끝 어딘가(lim)에서는 균등한 출현빈도를 보일 것이라고 가정하겠습니다.
그렇다면 1회 차부터 현재까지 출현한 각 번호별 통계를 바탕으로 출현빈도의 평균을 추출하고, 평균에 미달하는 빈도를 가진 번호가 추후 출현할 것이라고 가정하였습니다.
전제 2) 프랙탈 구조일 것
자연에서 발견되는 모양이나 패턴 중 전체의 구조가 그것을 이루는 부분에서도 발견되는 것을 종종 목격하게 됩니다. 위의 1번 전제를 전체 모수가 따른다면 그것에서 추출한 부분(표본) 또한 이를 따를 것입니다.
이번 분석에서는 전제2를 가정하면서도 '최신성'을 고려하는 두 마리 토끼를 동시에 잡기 위해 최근 5회 차 로또 당첨 번호의 경향을 변수에 포함시켰습니다.
구체적인 구현 방향은 아래의 아이디어로 실현했습니다.
1. 45개 번호(1~45)를 45의 공약수 묶음인 5번대, 9번대, 15번대로 나눔
(*3번대 묶음은 표본이 너무 작아져 전체 경향을 왜곡할 것이라 판단하여 배제)
2. 각 공약수 묶음 번호대의 최근 5회차 출현 횟수를 적음
(*보너스 번호를 제외한 순수 매 회차의 6개 번호를 기준으로 각 묶음의 횟수 합은 30이 됩니다.)
3. 각 번호대 구간별 횟수들의 평균을 구하고, 이보다 미달되는 번호대 숫자에 가중치 부여(반대의 경우는 상대적으로 가감치가 부여됨)
4. 최신성을 추가 포함시키기 위해 최근 5회차 미출현 번호 가중치 합산
프랙탈은 자연의 신비 중 조화에 초점을 맞춘 것입니다.
물론 5회 차만으로 전체의 경향성을 동등하게 반영한다고 보기는 다소 어렵습니다. 로또 번호를 예측한다는 것이 사실상 각 회차가 독립적으로 진행되는 확률의 특성상 불가능합니다만, 억지로 하는 것인 만큼 일종의 문학에서 나오는 시적 허용 정도로 생각하기로 했습니다.
최근 5회차 미출현 번호 가중치 부여 이유
인터넷 서치를 하다 보면 어떤 글에서는 최근 출현 경향이 강한 번호를 더 반영하는 방식을 사용하기도 하는 것 같습니다. 하지만, 저의 분석법에서는 이런 방식이 대전제1을 무시하는 방식이라 여겨 철저하게 미출현 번호에만 가중치를 부여하는 방법을 적용하였습니다.
전제 3) 우연의 산물 오차 인정
위의 1~2 전제를 바탕으로 자체 개발한 가중치 부여 방식을 바탕으로 45개 번호는 각각의 특정 가중치 합산 값을 받습니다. 따라서 단순히 1~45개 숫자 중 임의(랜덤) 추출을 진행하여 6개 숫자를 뽑는 로또 번호 추첨 방식과는 차이가 있습니다.
가중치 합산을 3묶음으로 나누는 방식을 선택했습니다.
3개의 묶음은 엑셀 조건부 서식 기능을 활용하여 아래와 같이 나누었습니다.(가중치 합산값이 동일한 중복의 문제로 실제로 각 묶음 개수는 매 회차 달라질 것입니다.)
- 상위 10개 번호
- 하위 10개 번호
- 나머지 번호
3개의 묶음에서 각각 3개 / 1개 / 2개 총 6개 당첨 예상 번호를 추출하여 로또 당첨 번호 후보군을 만듭니다. 가중치 합이 높다는 것은 그만큼 최근 덜 출현하여 평균 회귀 가정에 따라 앞으로의 출현이 촉망받는 번호라는 의미입니다.
따라서 상위 10개의 가중치 합이 높은 번호 중 3개의 가장 많은 예측 번호를 추출합니다. 왜 6개 모두를 이 그룹에서 추출하지 않는 것일까요?
그 물음에 대한 답이 저는 우연으로 인한 오차로 보았습니다. 위의 논리대로 상위 10개 번호 그룹에서만 추출하게 되었을 때는 하위 10 및 나머지 중간 가중치 번호들을 철저하게 배제하게 되며, 이렇게 되었을 때 오차를 반영할 수 없게 되기 때문입니다.
그렇다면 어째서 하위 10개와 나머지 두 그룹에서 추출 번호를 각각 1개와 2개로 뽑았느냐에 대한 답은 역시 우연 속에서도 1~2 전제를 따른다는 대원칙을 지키기 위해서입니다.
1108회 로또 당첨 번호 예측 후보군
앞서 언급한 과정대로 추출한 예상 번호 5줄 후보군을 드리겠습니다. 아래 이미지 확인하시면 확인하실 수 있으며, 긴 글 읽어주시느라 고생 많았습니다.
실제로 여기까지 몇 분이나 읽어보실지는 모르겠지만, 개인적인 논리가 마음에 드셨다면 한번 재미로 이번주 로또 번호는 아래 후보군을 참고하셔서 구입해 보시고, 공감도 한 번씩 눌러주시면 감사하겠습니다.
로또 번호 예측이라는 것은 사실 신의 영역입니다. 각 회차는 독립적으로 진행되며, 일정한 패턴을 가지고 있다고 보기 어렵기 때문입니다. 하지만, 단순히 유희를 목적으로라도 로또 당첨 번호 예측을 해보면 알게 됩니다. 그저 막연히 한주를 기다리는 것보다는 더 흥미진진하며, 내가 선택한 번호에 애착을 갖게 된다는 것을 말입니다.
'통계분석' 카테고리의 다른 글
1113회 로또 예상번호 1112회 로또 당첨번호 조회 분석 피드백 (0) | 2024.03.27 |
---|---|
1112회 로또 예상번호 1111회 로또 당첨 번호 조회 분석 피드백 (0) | 2024.03.17 |
1111회 로또 예상번호 1110회 로또 당첨 번호 조회 분석 피드백 (0) | 2024.03.10 |
1110회 로또 예상번호 1109회 로또 당첨 번호 조회 분석 피드백 (0) | 2024.03.03 |
1109회 로또 예상번호 1108회 로또 당첨 번호 조회 분석 피드백 (0) | 2024.02.25 |