SlideShare a Scribd company logo
1 of 21
Kyonggi Univ. AI Lab.
LANGUAGE GANS FALLING SHORT
2020.10.26
정규열
Artificial Intelligence Lab
Kyonggi Univiersity
Kyonggi Univ. AI Lab.
Index
 도입 배경
 Maximum Likelihood Estimation(MLE)
 Generative Adversarial Network - GAN
 Temperature Sweep
 Temperature Sweep을 이용한 MLE 성능
 결론
Kyonggi Univ. AI Lab.
도입 배경
Kyonggi Univ. AI Lab.
도입 배경
 전통적인 자연어 생성기법은 MLE(최대 우도 추정)기법으로 접근함
 그러나 노출 편향(exposure bias)의 문제가 존재한다.(Quality 저하)
 노출 편향의 문제를 해결하기 위해 GAN 기반으로 접근함
 그러나 다양성을 제한한다. (diversity 저하)
 MLE 기반으로 Quality- diversity의 Trade off를 극복하고자 함
 temperature sweep을 제안
 Softmax에 temperature를 적용하여 극복함
 MLE 기반으로 하여금 GAN의 정확도를 유지하며 diversity또한 얻을 수 있다.
MLE 기반에서 Quality - diversity 를 제어 하고자 함
Kyonggi Univ. AI Lab.
도입 배경
 Quality- diversity의 Trade off
Trade off Trade off 상쇄
Kyonggi Univ. AI Lab.
MAXIMUM LIKELIHOOD
ESTIMATION(MLE)
Kyonggi Univ. AI Lab.
Maximum Likelihood Estimation(MLE)
 최대 우도(가능도) 추정
 모수(평균, 표준편차 등)을 알 수 없을 때 적절한 분포를 찾는 과정.
일반적인 신경망의 학습 방법이다.
MSE
Cross Entropy
Kyonggi Univ. AI Lab.
Maximum Likelihood Estimation(MLE)
 최대 우도(가능도) 추정
 정규 분포의 예시
X: 사건
Y: 가능도(Likelihood)
분포에 영향을 받아 노출 편향의 문제가 발생한다.
Kyonggi Univ. AI Lab.
GENERATIVE ADVERSARIAL NETWORK -
GAN
Kyonggi Univ. AI Lab.
Generative Adversarial Network - GAN
 GAN
이러한 모델은 Quality를 개선 하였다. 그러나 Diversity를 저해 하였다.
Kyonggi Univ. AI Lab.
Generative Adversarial Network - GAN
 GAN의 mode collapsing 문제
학습 전 학습 후
특정 방향으로만 몰리게 되는 경우가 발생한다.
Kyonggi Univ. AI Lab.
Generative Adversarial Network - GAN
 GAN의 mode collapsing 문제
특정 방향으로만 몰리게 되는 경우가 발생한다.
개선된 GAN
일반적인 GAN
Kyonggi Univ. AI Lab.
Generative Adversarial Network - GAN
 GAN의 mode collapsing 문제
특정 방향으로만 몰리게 되는 경우가 발생한다.
개선된 GAN
일반적인 GAN
Kyonggi Univ. AI Lab.
Generative Adversarial Network - GAN
 자연어 생성 모델의 성능 지표 (Yaoming Zhu, 2018 제안)
Quality
Diversity
두가지 지표 모두 낮을수록 성능이 좋다.
GAN 기반 모델은 어떤 모델이 좋은지 알 수가 없다.
Kyonggi Univ. AI Lab.
TEMPERATURE SWEEP
Kyonggi Univ. AI Lab.
Temperature Sweep
 Softmax에 Temperature 를 적용하였다.
 Softmax의 성질
 큰 것은 아주 크게, 작은 것은 아주 작게 하는 성질이 있다.
 Temperature 를 적용하여 분포를 조절한다.
Temperature 0.5 Temperature 1 Temperature 5
Temperature 를 크게 줄 수록 각 확률 값들의 차이가 감소한다.
Temperature 를 작게 설정하여 완전히 확실한 것으로 선택한다.
Kyonggi Univ. AI Lab.
Temperature Sweep
 Temperature 에 따른 결과
• Temperature 값이 작을 수록 정확도는 올라간다.
• 기본적으로 MLE 기반 이기 때문에 diversity는 어느정도 보장 된다.
• 단 Temperature를 한없이 낮추면 동일한 문장만 생성한다.
적절한 정도(0.7)로 Temperature를 설정해야 한다.
정확성
상승
Kyonggi Univ. AI Lab.
TEMPERATURE SWEEP을 이용한 MLE 성능
Kyonggi Univ. AI Lab.
Temperature Sweep을 이용한 MLE 성능
 자연어 생성 모델의 성능 지표
MLE 기반 모델의 성능이 우수하다.
quality
diversity Diversity - quality
quality
Yaoming Zhu, 2018 제안 C´ıfka et al., 2018 제안
Kyonggi Univ. AI Lab.
결론
Kyonggi Univ. AI Lab.
결론
 기존 MLE 모델은 노출 편향의 문제가 있다.
 이러한 문제 때문에 GAN 기반으로 접근하였다.
 Quality는 개선되었지만 Diversity 가 저하 되었다.
 따라서 Quality – Diversity 사이의 Trade off를 해결하는 기법이 필요하다.
 이에 MLE 기반의 Temperature Sweep의 기법을 제안 하였다.
 기존 softmax 함수에 Temperature 를 추가하여 조절 하였다.

More Related Content

Featured

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Language gans falling short

  • 1. Kyonggi Univ. AI Lab. LANGUAGE GANS FALLING SHORT 2020.10.26 정규열 Artificial Intelligence Lab Kyonggi Univiersity
  • 2. Kyonggi Univ. AI Lab. Index  도입 배경  Maximum Likelihood Estimation(MLE)  Generative Adversarial Network - GAN  Temperature Sweep  Temperature Sweep을 이용한 MLE 성능  결론
  • 3. Kyonggi Univ. AI Lab. 도입 배경
  • 4. Kyonggi Univ. AI Lab. 도입 배경  전통적인 자연어 생성기법은 MLE(최대 우도 추정)기법으로 접근함  그러나 노출 편향(exposure bias)의 문제가 존재한다.(Quality 저하)  노출 편향의 문제를 해결하기 위해 GAN 기반으로 접근함  그러나 다양성을 제한한다. (diversity 저하)  MLE 기반으로 Quality- diversity의 Trade off를 극복하고자 함  temperature sweep을 제안  Softmax에 temperature를 적용하여 극복함  MLE 기반으로 하여금 GAN의 정확도를 유지하며 diversity또한 얻을 수 있다. MLE 기반에서 Quality - diversity 를 제어 하고자 함
  • 5. Kyonggi Univ. AI Lab. 도입 배경  Quality- diversity의 Trade off Trade off Trade off 상쇄
  • 6. Kyonggi Univ. AI Lab. MAXIMUM LIKELIHOOD ESTIMATION(MLE)
  • 7. Kyonggi Univ. AI Lab. Maximum Likelihood Estimation(MLE)  최대 우도(가능도) 추정  모수(평균, 표준편차 등)을 알 수 없을 때 적절한 분포를 찾는 과정. 일반적인 신경망의 학습 방법이다. MSE Cross Entropy
  • 8. Kyonggi Univ. AI Lab. Maximum Likelihood Estimation(MLE)  최대 우도(가능도) 추정  정규 분포의 예시 X: 사건 Y: 가능도(Likelihood) 분포에 영향을 받아 노출 편향의 문제가 발생한다.
  • 9. Kyonggi Univ. AI Lab. GENERATIVE ADVERSARIAL NETWORK - GAN
  • 10. Kyonggi Univ. AI Lab. Generative Adversarial Network - GAN  GAN 이러한 모델은 Quality를 개선 하였다. 그러나 Diversity를 저해 하였다.
  • 11. Kyonggi Univ. AI Lab. Generative Adversarial Network - GAN  GAN의 mode collapsing 문제 학습 전 학습 후 특정 방향으로만 몰리게 되는 경우가 발생한다.
  • 12. Kyonggi Univ. AI Lab. Generative Adversarial Network - GAN  GAN의 mode collapsing 문제 특정 방향으로만 몰리게 되는 경우가 발생한다. 개선된 GAN 일반적인 GAN
  • 13. Kyonggi Univ. AI Lab. Generative Adversarial Network - GAN  GAN의 mode collapsing 문제 특정 방향으로만 몰리게 되는 경우가 발생한다. 개선된 GAN 일반적인 GAN
  • 14. Kyonggi Univ. AI Lab. Generative Adversarial Network - GAN  자연어 생성 모델의 성능 지표 (Yaoming Zhu, 2018 제안) Quality Diversity 두가지 지표 모두 낮을수록 성능이 좋다. GAN 기반 모델은 어떤 모델이 좋은지 알 수가 없다.
  • 15. Kyonggi Univ. AI Lab. TEMPERATURE SWEEP
  • 16. Kyonggi Univ. AI Lab. Temperature Sweep  Softmax에 Temperature 를 적용하였다.  Softmax의 성질  큰 것은 아주 크게, 작은 것은 아주 작게 하는 성질이 있다.  Temperature 를 적용하여 분포를 조절한다. Temperature 0.5 Temperature 1 Temperature 5 Temperature 를 크게 줄 수록 각 확률 값들의 차이가 감소한다. Temperature 를 작게 설정하여 완전히 확실한 것으로 선택한다.
  • 17. Kyonggi Univ. AI Lab. Temperature Sweep  Temperature 에 따른 결과 • Temperature 값이 작을 수록 정확도는 올라간다. • 기본적으로 MLE 기반 이기 때문에 diversity는 어느정도 보장 된다. • 단 Temperature를 한없이 낮추면 동일한 문장만 생성한다. 적절한 정도(0.7)로 Temperature를 설정해야 한다. 정확성 상승
  • 18. Kyonggi Univ. AI Lab. TEMPERATURE SWEEP을 이용한 MLE 성능
  • 19. Kyonggi Univ. AI Lab. Temperature Sweep을 이용한 MLE 성능  자연어 생성 모델의 성능 지표 MLE 기반 모델의 성능이 우수하다. quality diversity Diversity - quality quality Yaoming Zhu, 2018 제안 C´ıfka et al., 2018 제안
  • 20. Kyonggi Univ. AI Lab. 결론
  • 21. Kyonggi Univ. AI Lab. 결론  기존 MLE 모델은 노출 편향의 문제가 있다.  이러한 문제 때문에 GAN 기반으로 접근하였다.  Quality는 개선되었지만 Diversity 가 저하 되었다.  따라서 Quality – Diversity 사이의 Trade off를 해결하는 기법이 필요하다.  이에 MLE 기반의 Temperature Sweep의 기법을 제안 하였다.  기존 softmax 함수에 Temperature 를 추가하여 조절 하였다.