[A/B ν…ŒμŠ€νŠΈ] A/B ν…ŒμŠ€νŠΈλž€?

2022. 3. 21. 15:27Β· πŸ” 데이터 뢄석/04. Data Analysis
728x90

μΆ”μ²œμ‹œμŠ€ν…œμ„ κ³΅λΆ€ν•˜λ©΄μ„œ ν˜„μ—…μ—μ„œ A/Bν…ŒμŠ€νŠΈλ₯Ό 톡해 μ μš©μ„ 많이 ν•œλ‹€κ³  ν•˜λ”λΌκ΅¬μš”

μ •μž‘ A/Bν…ŒμŠ€νŠΈκ°€ 무엇인지 감이 잘 μ•ˆμž‘ν˜€μ„œ ν¬μŠ€νŒ…ν•΄λ³΄λ €κ³  ν•©λ‹ˆλ‹€!

 

 

A/Bν…ŒμŠ€νŠΈλž€?

A/Bν…ŒμŠ€νŠΈλŠ” κΈ°μ‘΄ μ„œλΉ„μŠ€(A)와 μƒˆλ‘œ μ μš©ν•˜κ³  싢은 μ„œλΉ„μŠ€(B)λ₯Ό 톡계적인 λ°©λ²•μœΌλ‘œ λΉ„κ΅ν•˜μ—¬ μƒˆλ‘œμš΄ μ„œλΉ„μŠ€κ°€ κΈ°μ‘΄ μ„œλΉ„μŠ€μ— λΉ„ν•΄ 정말 νš¨κ³Όκ°€ μžˆλŠ”μ§€λ₯Ό μ•Œμ•„λ³΄λŠ” 방법.

 

 

 

A/Bν…ŒμŠ€νŠΈ 방법

 

A/B ν…ŒμŠ€νŠΈλŠ” λ‹€μŒκ³Ό 같이 크게 4λ‹¨κ³„λ‘œ μ΄λ£¨μ–΄μ ΈμžˆμŠ΅λ‹ˆλ‹€.

 

1. κ°€μ„€ μ„€μ •

2. λ©”νŠΈλ¦­ μ •μ˜

3. μ‹€ν—˜ 섀계

4. κ²°κ³Ό λ„μΆœ

 


1. κ°€μ„€ μ„€μ •

 

: κ°€μ„€ μ„€μ •μ—μ„œ 가섀은 톡계적인 방법을 μ΄μš©ν•˜μ—¬ 참인지 거짓인지λ₯Ό νŒλ³„ν•  수 μžˆλŠ” λͺ…μ œλ‘œμ¨ κ²€μ¦ν•˜κ³ μž ν•˜λŠ” 것이 무엇인지λ₯Ό λ¬Έμž₯ν˜•νƒœλ‘œ κ΅¬μ²΄ν™”ν•˜λŠ” 것이닀.

 

예) μ–΄λ–€ ν™ˆνŽ˜μ΄μ§€ μš΄μ˜μžκ°€ λ²„νŠΌμ˜ 색깔을 λ°”κΏ”μ„œ λ‹€μš΄λ‘œλ“œ 횟수λ₯Ό 올리고 μ‹Άλ‹€κ³  ν• λ•Œ, 가섀은

 

λ‹€μš΄λ‘œλ“œ λ²„νŠΌμ˜ 색상을 λ°”κΎΈλ©΄ κΈ°μ‘΄ 빨간색일 λ•Œλ³΄λ‹€ 더 λ§Žμ€ μ‚¬μš©μžκ°€ λ‹€μš΄λ‘œλ“œ ν•  것이닀!

 

 

즉, μƒˆλ‘­κ²Œ μ μš©ν•΄λ³΄κ³ μž ν•˜λŠ” 것은 ν™ˆνŽ˜μ΄μ§€ ν™”λ©΄μ˜ λ‹€μš΄λ‘œλ“œ λ²„νŠΌ 색상을 λ°”κΎΈλŠ” κ²ƒμž…λ‹ˆλ‹€.

이제 1μ°¨ 가섀을 ꡬ체화해야 ν•©λ‹ˆλ‹€. μ—¬κΈ°μ„œλŠ” λ²„νŠΌ 색상을 λ¬΄μ—‡μœΌλ‘œ ν• μ§€ κ²°μ •ν•΄μ•Όν•©λ‹ˆλ‹€. μ΄λ•Œ 색상 κ΄€λ ¨ μ „λ¬Έκ°€μ—κ²Œ μ‚¬μš©μžκ°€ μ„ ν˜Έν•˜λŠ” 색상이 무엇인지 쑰언을 ꡬ할 μˆ˜λ„ 있고, 섀문쑰사λ₯Ό 톡해 μ‚¬μš©μžκ°€ μ›ν•˜λŠ” 색상이 무엇인지 사전에 νŒŒμ•…ν•˜μ—¬ λ°”κΏ€ μƒ‰μƒμ˜ 후보λ₯Ό μ •ν•  μˆ˜λ„ μžˆλ‹€.

 

μ—¬κΈ°μ„œλŠ” 섀문쑰사λ₯Ό ν•΄μ„œ μ‚¬μš©μžκ°€ κ°€μž₯ μ„ ν˜Έν•˜λŠ” 색상이 μ΄ˆλ‘μƒ‰μ΄λΌλŠ” 것을 μ•Œμ•˜λ‹€κ³  κ°€μ •ν•΄λ³΄κ² μŠ΅λ‹ˆλ‹€!

-> 이후 κ΅¬μ²΄ν™”λœ 가섀은

 

λ‹€μš΄λ‘œλ“œ λ²„νŠΌμ˜ 색상을 μ΄ˆλ‘μƒ‰μœΌλ‘œ λ°”κΎΈλ©΄
κΈ°μ‘΄ 빨간색일 λ•Œλ³΄λ‹€ 더 λ§Žμ€ μ‚¬μš©μžκ°€ λ‹€μš΄λ‘œλ“œν•  것이닀!

 


2. λ©”νŠΈλ¦­ μ •μ˜

 

: 가섀을 μ„€μ •ν–ˆλ‹€λ©΄ 이 가섀이 참인지 거짓인지λ₯Ό 보이기 μœ„ν•œ μΈ‘μ • 기쀀이 ν•„μš”ν•œλ° 이λ₯Ό λ©”νŠΈλ¦­(Metric)이라고 ν•œλ‹€. λ©”νŠΈλ¦­μ€ κ²€μ¦ν•˜κ³ μž ν•˜λŠ” 가섀에 따라 달라진닀.

 

예) μš°λ¦¬κ°€ μœ„ κ°€μ„€μ—μ„œ 검증할 것은 "λ²„νŠΌμ˜ 색상을 μ΄ˆλ‘μƒ‰μœΌλ‘œ λ°”κΎΈμ—ˆμ„ λ•Œ λ‹€μš΄λ‘œλ“œ νšŸμˆ˜κ°€ λΉ¨κ°„μƒ‰μ΄μ—ˆμ„ λ•Œλ³΄λ‹€ 더 λ§Žμ€κ°€?"이닀. λ”°λΌμ„œ μ—¬κΈ°μ„œ λ©”νŠΈλ¦­μ€ λ‹€μš΄λ‘œλ“œ νšŸμˆ˜κ°€ λœλ‹€. 

 

λ©”νŠΈλ¦­μ€ ν•˜λ‚˜μ˜ 가섀에 λŒ€ν•΄μ„œ 두 개 이상이 될 μˆ˜λ„ μžˆλ‹€. λ§Œμ•½ μ‹€μ œλ‘œ μ‚¬μš©μžκ°€ λ‹¨μˆœνžˆ μ‹€μˆ˜κ°€ μ•„λ‹Œ ν•„μš”μ— μ˜ν•΄μ„œ λ‹€μš΄λ‘œλ“œ ν–ˆλŠ”μ§€λ₯Ό ν™•μΈν•˜κΈ° μœ„ν•΄μ„œ λ‹€μš΄λ‘œλ“œ μ·¨μ†Œ 횟수λ₯Ό λ©”νŠΈλ¦­μœΌλ‘œ μΆ”κ°€ν•  μˆ˜λ„ μžˆλ‹€.

 


3. μ‹€ν—˜ 섀계

 

: μ‹€ν—˜ μ„€κ³„μ—μ„œλŠ” κΈ°μ‘΄ ν™˜κ²½κ³Ό 가섀을 검증할 μ‹€ν—˜ ν™˜κ²½μ„ μ€€λΉ„ν•˜κ³  집단을 λ‘κ°œλ‘œ λ‚˜λˆ„μ–΄ ν•˜λ‚˜λŠ” κΈ°μ‘΄ ν™˜κ²½μ— λ‹€λ₯Έ ν•˜λ‚˜λŠ” μ‹€ν—˜ ν™˜κ²½μ— λ°°μ •ν•˜κ²Œ λœλ‹€. 

 

- μ‹€ν—˜ ν™˜κ²½ : 검증할 μš”μ†Œ μ™Έ λ‹€λ₯Έ μš”μ†Œλ“€μ€ κΈ°μ‘΄ ν™˜κ²½κ³Ό λͺ¨λ‘ λ™μΌν•˜κ²Œ λ§Œλ“€μ–΄μ•Όν•œλ‹€..!

=> 검증할 μš”μ†Œκ°€ μ΄ˆλ‘μƒ‰ λ²„νŠΌμ΄λΌλ©΄ λ²„νŠΌ 색상 μ™Έ λ‹€λ₯Έ μš”μ†Œλ“€μ€ κΈ°μ‘΄ ν™˜κ²½κ³Ό μ‹€ν—˜ ν™˜κ²½μ΄ 동일해야 ν•œλ‹€. κ²€μ¦ν•˜κ³ μž ν•˜λŠ” κ²°κ³Ό(λ‹€μš΄λ‘œλ“œ 횟수 증가)와 바뀐 λΆ€λΆ„(λ²„νŠΌ 색상)의 연관성을 μ •ν™•ν•˜κ²Œ νŒŒμ•…ν•˜κΈ° μœ„ν•΄μ„œ..

 

- μ‹€ν—˜ ν™˜κ²½μ΄ μ€€λΉ„λ˜μ—ˆλ‹€λ©΄ 두 집단을 ν•˜λ‚˜λŠ” κΈ°μ‘΄ ν™˜κ²½μ— ν•˜λ‚˜λŠ” μ‹€ν—˜ ν™˜κ²½μ— λ°°μ •ν•΄μ•Όν•œλ‹€. 집단을 λ°°μ •ν•  λ•Œ λ°˜λ“œμ‹œ λžœλ€ν•˜κ²Œ λ°°μ •ν•΄μ•Ό μ‹€ν—˜ 결과에 λŒ€ν•œ 해석을 μ •ν™•ν•˜κ²Œ ν•  수 μžˆλ‹€.

 


4. κ²°κ³Ό λ„μΆœ

 

: μ‹€ν—˜ 섀계가 μ™„λ£Œλ˜λ©΄ 이제 두 집단에 λŒ€ν•˜μ—¬ 미리 μ •μ˜ν•œ λ©”νŠΈλ¦­μ„ κ³„μ‚°ν•œλ‹€. 

예) λΉ¨κ°„ λ²„νŠΌμΌ λ•Œμ˜ λ‹€μš΄λ‘œλ“œ νšŸμˆ˜μ™€ 초둝 λ²„νŠΌμΌ λ•Œμ˜ λ‹€μš΄λ‘œλ“œ 횟수λ₯Ό 계산

 

톡계적인 방법을 μ΄μš©ν•˜μ—¬ 가섀을 κ²€μ •ν•˜μ—¬ 이 두 μ§‘λ‹¨μ—μ„œ κ΅¬ν•œ λ©”νŠΈλ¦­μ˜ 차이가 μœ μ˜λ―Έν•œμ§€ 확인.

κ²€μ •μ˜ κ²°κ³Ό ν†΅κ³„μ μœΌλ‘œ μœ μ˜λ―Έν•œ 차이가 μžˆλ‹€λ©΄ μš°λ¦¬λŠ” μƒˆλ‘­κ²Œ μ μš©ν•œ μ„œλΉ„μŠ€κ°€ 기쑴의 μ„œλΉ„μŠ€λ³΄λ‹€ 더 λ‚«λ‹€κ³  νŒλ‹¨.

-> 상황에 따라 톡계적 가섀검정을 μƒλž΅ν•˜κ³  κ·Έλž˜ν”„λ‘œ 차이가 μžˆλŠ”μ§€ μ—†λŠ”μ§€λ₯Ό νŒλ‹¨ν•˜λŠ” κ²½μš°λ„ 있음!

 

μ—¬κΈ°μ„œ 주둜 μ‚¬μš©λ˜λŠ” 톡계적 κ°€μ„€ κ²€μ • 방법은 2ν‘œλ³Έ t-κ²€μ •!

 

*t-test에 λŒ€ν•œ 것은 이 글을 μ°Έκ³ ν•΄μ£Όμ„Έμš§..!

2022.03.15 - [데이터 뢄석/04. Data Analysis] - [Python] t-test

 

[Python] t-test

λͺ¨ν‰κ· μ— λŒ€ν•œ μœ μ˜μ„± κ²€μ •μœΌλ‘œ t-test 검정을 μ‹€μ‹œν•œλ‹€. λ‹€μŒκ³Ό 같이 크게 μ„Έκ°€μ§€μ˜ 방법이 μžˆλ‹€. 1. λ‹¨μΌν‘œλ³Έ t-κ²€μ •(One-sample t-test) 2. λ…λ¦½ν‘œλ³Έ t-κ²€μ •(Independent-tw-sample t-test) 3. λŒ€μ‘ν‘œλ³Έ t-κ²€μ •..

xod22.tistory.com

 

λ§Œμ•½ ν†΅κ³„μ μœΌλ‘œ μœ μ˜ν•œ 차이가 μ—†λ‹€λ©΄ κ°€μ„€ 섀정에 λ¬Έμ œλŠ” μ—†μ—ˆλŠ”μ§€, μ‹€ν—˜ μ„€κ³„μ—μ„œ 잘λͺ»λœ 뢀뢄은 μ—†μ—ˆλŠ”μ§€, λ°μ΄ν„°λŠ” μΆ©λΆ„νžˆ ν™•λ³΄λ˜μ—ˆλŠ”μ§€λ₯Ό ν™•μΈν•˜μ—¬ λ‹€μ‹œ κ°€μ„€ κ²€μ • 절차λ₯Ό μˆ˜ν–‰ν•œλ‹€..!

 

 

 

A/B ν…ŒμŠ€νŠΈμ˜ μž₯단점

 

- μž₯점

1. μƒˆλ‘œμš΄ 방식이 기쑴방식에 λΉ„ν•΄ νš¨κ³Όκ°€ μžˆλŠ”κ°€μ— λŒ€ν•œ 닡을 비ꡐ적 λΉ λ₯΄κ²Œ 제곡

2. μƒˆλ‘­κ²Œ μ μš©ν•  μ„œλΉ„μŠ€μ™€ κΈ°μ‘΄ μ„œλΉ„μŠ€λ₯Ό 비ꡐ할 수 μžˆλŠ” λͺ¨λ“  뢄야에 적용 κ°€λŠ₯(μ‹ μ•½ 개발, μ›Ή λ§ˆμΌ€νŒ…, μ •μ±… 효과 λ“±)

3. μ›Ήμ„œλΉ„μŠ€ λΆ„μ•Όμ—μ„œ μƒˆλ‘œμš΄ UX/UI에 λŒ€ν•œ 효과λ₯Ό A/Bν…ŒμŠ€νŠΈλ₯Ό 톡해 μ•Œμ•„λ΄„μœΌλ‘œμ¨ μ§€μ†μ μœΌλ‘œ μ‚¬μš©μžμ˜ νŽΈμ˜μ„±μ„ μ¦λŒ€μ‹œν‚€λŠ” λ°©ν–₯으둜 μ›Ή μ„œλΉ„μŠ€λ₯Ό κ°œμ„  κ°€λŠ₯

 

 

- 단점

1. μ‹€ν—˜μ„€κ³„λ₯Ό μž˜ν–ˆλ‹€κ³  ν•΄μ„œ κ°€μ„€κ²€μ •μ—μ„œ 보고자 ν–ˆλ˜ 결과와 μš”μΈ μ‚¬μ΄μ˜ 인과관계λ₯Ό μ •ν™•νžˆ μ•Œ 수 μ—†λ‹€.

-> μœ„ μ‹€ν—˜κ°™μ€ 경우 λ²„νŠΌμ˜ μƒ‰μƒλ³€κ²½μœΌλ‘œ λ‹€μš΄λ‘œλ“œ νšŸμˆ˜κ°€ λŠ˜μ–΄λ‚¬λ‹€κ³  해도 κ·Έ μ‹œμ μ— 경쟁 μ›Ήμ‚¬μ΄νŠΈκ°€ μ—†μ–΄μ‘Œκ±°λ‚˜ 날씨 λ“±μ˜ 이유둜 μ§‘μ—μ„œ 인터넷을 ν•˜λŠ” μ‚¬λžŒλ“€μ΄ μΌμ‹œμ μœΌλ‘œ μ¦κ°€ν•΄μ„œ λ‹€μš΄λ‘œλ“œ νšŸμˆ˜κ°€ λŠ˜μ–΄λ‚œ 것일 μˆ˜λ„ 있기 λ•Œλ¬Έ

 

2. μƒˆλ‘œμš΄ 방식이 기쑴의 방식과 크게 μ°¨μ΄λ‚œλ‹€λ©΄ A/Bν…ŒμŠ€νŠΈλŠ” κ²°κ³Όκ°€ 잘λͺ»λ  수 있으며 λ¦¬μŠ€ν¬κ°€ ꡉμž₯히 μ»€μ§€κ²Œλ¨

-> κΈ°μ‘΄ λ””μžμΈλ³΄λ‹€ 바뀐것이 λ§Žλ‹€λ©΄ μ‚¬μš©μžμ˜ ν˜Όλž€μ„ κ°€μ€‘μ‹œμΌœ μ΄νƒˆλ₯ μ΄ λ†’μ•„μ§€κ²Œ ν•  수 있음...

728x90

'πŸ” 데이터 뢄석 > 04. Data Analysis' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€

[빅데이터] 톡합 데이터 지도(빅데이터 ν”Œλž«νΌ) μ†Œκ°œ  (0) 2022.04.06
[Python] μ„œμšΈ 쒅합병원 뢄포 데이터 뢄석  (0) 2022.03.24
[톡계적 λͺ¨λΈλ§] μ‹œκ³„μ—΄ 뢄석 - 예츑  (0) 2022.03.21
[톡계적 λͺ¨λΈλ§] μ‹œκ³„μ—΄ 뢄석 - κ²°μΈ‘κ°’ μ²˜λ¦¬μ™€ Smoothing  (0) 2022.03.20
[톡계적 λͺ¨λΈλ§] μ‹œκ³„μ—΄ 뢄석 - 정상성(stationary)κ³Ό μ°¨λΆ„  (0) 2022.03.19
'πŸ” 데이터 뢄석/04. Data Analysis' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€
  • [빅데이터] 톡합 데이터 지도(빅데이터 ν”Œλž«νΌ) μ†Œκ°œ
  • [Python] μ„œμšΈ 쒅합병원 뢄포 데이터 뢄석
  • [톡계적 λͺ¨λΈλ§] μ‹œκ³„μ—΄ 뢄석 - 예츑
  • [톡계적 λͺ¨λΈλ§] μ‹œκ³„μ—΄ 뢄석 - κ²°μΈ‘κ°’ μ²˜λ¦¬μ™€ Smoothing
xod22
xod22
xod22
Data Analyst Story
xod22
전체
였늘
μ–΄μ œ
  • 🌳 Home 🌳 (178)
    • 🐬 MySQL (46)
      • λ¬Έμ œν’€μ΄ (29)
      • SQL 데이터뢄석 μΊ ν”„ (9)
    • πŸ” 데이터 뢄석 (53)
      • Product (5)
      • 01. Data Collection (7)
      • 02. Data Processing (7)
      • 03. Data Visualizaton (15)
      • 04. Data Analysis (19)
    • πŸ“š Study (20)
      • 빅데이터 뢄석기사 μ‹€κΈ° (8)
      • ADP μ‹€κΈ° (7)
      • ꡬ글 μ• λ„λ¦¬ν‹±μŠ€ (5)
      • ν”„λ‘œμ νŠΈ (0)
    • ✏️ 생각 기둝 (10)
      • λ…μ„œ (5)
      • 자료 슀크랩 (2)
      • μ·¨μ—… μ€€λΉ„ (2)
    • πŸ’» GitHub (6)
      • μˆ˜μ • 및 λ³€κ²½ (5)
    • 🏁 λ¨Έμ‹ λŸ¬λ‹ | λ”₯λŸ¬λ‹ (35)
      • μΆ”μ²œμ‹œμŠ€ν…œ (19)
      • 이미지 λΆ„λ₯˜ (1)
      • ν…μŠ€νŠΈ 뢄석 (10)

곡지사항

  • Github
  • How to ꡬ독, μ’‹μ•„μš”

인기 κΈ€

졜근 λŒ“κΈ€

λΈ”λ‘œκ·Έ 메뉴

  • ν™ˆ
  • νƒœκ·Έ
  • λ°©λͺ…둝

νƒœκ·Έ

  • github
  • ν…μŠ€νŠΈλΆ„μ„
  • 톡계적λͺ¨λΈλ§
  • κ΅¬κΈ€μ• λ„λ¦¬ν‹±μŠ€
  • κΉƒν—ˆλΈŒ
  • λΉ…λΆ„κΈ°
  • tableau
  • 데이터뢄석
  • μ‹œκ°ν™”
  • μ„Έλ―Έλ‚˜
  • μΆ”μ²œμ‹œμŠ€ν…œ
  • λ°μ΄ν„°λ¦¬μ•ˆ
  • 파이썬
  • λ°μ΄ν„°μ‹œκ°ν™”
  • MySQL
  • Plot
  • μž‘μ—…ν˜•μ œ1μœ ν˜•
  • 크둀링
  • κΈ°μΆœν’€μ΄
  • ν”„λ‘œκ·Έλž˜λ¨ΈμŠ€
  • μ½”λ”©ν…ŒμŠ€νŠΈ
  • μ „μ²˜λ¦¬
  • ADPμ‹€κΈ°
  • νƒœλΈ”λ‘œ
  • ν•΄μ»€λž­ν¬
  • 빅데이터뢄석기사
  • λŸ¬λ‹μŠ€ν‘Όμ¦ˆ
  • pandas
  • SQL
  • Python

졜근 κΈ€

hELLO Β· Designed By μ •μƒμš°.v4.2.0
xod22
[A/B ν…ŒμŠ€νŠΈ] A/B ν…ŒμŠ€νŠΈλž€?
μƒλ‹¨μœΌλ‘œ

ν‹°μŠ€ν† λ¦¬νˆ΄λ°”

κ°œμΈμ •λ³΄

  • ν‹°μŠ€ν† λ¦¬ ν™ˆ
  • 포럼
  • 둜그인

단좕킀

λ‚΄ λΈ”λ‘œκ·Έ

λ‚΄ λΈ”λ‘œκ·Έ - κ΄€λ¦¬μž ν™ˆ μ „ν™˜
Q
Q
μƒˆ κΈ€ μ“°κΈ°
W
W

λΈ”λ‘œκ·Έ κ²Œμ‹œκΈ€

κΈ€ μˆ˜μ • (κΆŒν•œ μžˆλŠ” 경우)
E
E
λŒ“κΈ€ μ˜μ—­μœΌλ‘œ 이동
C
C

λͺ¨λ“  μ˜μ—­

이 νŽ˜μ΄μ§€μ˜ URL 볡사
S
S
맨 μœ„λ‘œ 이동
T
T
ν‹°μŠ€ν† λ¦¬ ν™ˆ 이동
H
H
단좕킀 μ•ˆλ‚΄
Shift + /
⇧ + /

* λ‹¨μΆ•ν‚€λŠ” ν•œκΈ€/영문 λŒ€μ†Œλ¬Έμžλ‘œ 이용 κ°€λŠ₯ν•˜λ©°, ν‹°μŠ€ν† λ¦¬ κΈ°λ³Έ λ„λ©”μΈμ—μ„œλ§Œ λ™μž‘ν•©λ‹ˆλ‹€.