Mạng đối nghịch tạo sinh GAN - Generative Adversarial Network

1244
26-02-2024
Mạng đối nghịch tạo sinh GAN - Generative Adversarial Network

Mạng đối nghịch tạo sinh GAN là gì?

Generative Adversarial Network (GAN) là một mô hình học máy đặc biệt được giới thiệu bởi Ian Goodfellow và các đồng nghiệp vào năm 2014. GAN bao gồm hai mạng nơ-ron cạnh tranh với nhau: một mạng tạo ra dữ liệu giả (mạng sinh) và một mạng phân biệt dữ liệu thật và giả (mạng phân biệt).

Mạng đối nghịch tạo sinh GAN là gì?

GAN được gọi là mạng đối nghịch vì đào tạo hai mạng khác nhau và để hai mạng này cạnh tranh với nhau. Hai mạng này cùng cố gắng cải thiện bản thân thông qua quá trình cạnh tranh, khi mạng sinh cố gắng tạo ra dữ liệu giả tốt hơn để đánh lừa mạng phân biệt, và mạng phân biệt cố gắng nâng cao khả năng phân biệt giữa dữ liệu thật và giả.

Nên sử dụng mạng đối nghịch tạo sinh GAN trong những trường hợp nào?

1. Tạo hình ảnh

Mạng đối nghịch tạo sinh GAN tổng hợp tạo ra đồ họa chân thực thông qua lời nhắc dựa trên văn bản hoặc bằng cách thay đổi hình ảnh hiện có. Chúng có thể đóng góp vào trải nghiệm hình ảnh chân thực và sống động trong trò chơi điện tử và giải trí kỹ thuật số.

GAN cũng có thể thay đổi ảnh, chẳng hạn như chuyển đổi hình ảnh chất lượng thấp sang độ phân giải cao hoặc thay đổi hình ảnh đen trắng sang màu. Nó cũng có thể tạo ra khuôn mặt, nhân vật và động vật thực tế để sử dụng trong hoạt hình và video.

2. Tạo dữ liệu đào tạo cho các mô hình khác nhau

Tăng cường dữ liệu trong học máy (ML) mở rộng tập huấn luyện một cách giả tạo bằng cách tạo ra các bản sao đã sửa đổi của tập dữ liệu từ dữ liệu hiện có.

Các mô hình tổng hợp có thể được sử dụng để tăng cường dữ liệu nhằm tạo ra dữ liệu tổng hợp có tất cả các đặc điểm của dữ liệu thực tế. Ví dụ: nó có thể tạo ra dữ liệu giao dịch gian lận, sau đó có thể được sử dụng để đào tạo một hệ thống máy học phát hiện gian lận khác. Thông tin này có thể giúp hệ thống phân biệt giữa các giao dịch đáng ngờ và hợp pháp.

3. Hoàn thiện những thông tin còn thiếu

Đôi khi bạn muốn mô hình tổng quát dự đoán chính xác và hoàn thành một số thông tin còn thiếu trong tập dữ liệu.

Ví dụ: bằng cách hiểu mối quan hệ giữa dữ liệu bề mặt và cấu trúc bên dưới, bạn có thể huấn luyện GAN để tạo ra các hình ảnh về bề mặt bên dưới. Nó có thể xây dựng những bức ảnh dưới bề mặt mới bằng cách kiểm tra những bức ảnh hiện có và sử dụng bản đồ địa hình cho các ứng dụng năng lượng như lập bản đồ địa nhiệt hoặc thu hồi và lưu trữ carbon.

4. Tạo mô hình 3D bằng dữ liệu 2D

GAN có thể tạo mô hình 3D từ ảnh 2D hoặc ảnh quét. Ví dụ: trong chăm sóc sức khỏe, GAN tích hợp tia X và các hình ảnh quét cơ thể khác để tạo ra hình ảnh cơ quan thực tế nhằm lập kế hoạch và mô phỏng phẫu thuật.

Cách hoạt động của mạng đối nghịch tạo sinh GAN

Một hệ thống mạng đối thủ tổng quát bao gồm hai mạng thần kinh sâu: mạng tạo và mạng phân biệt đối xử. Cả hai mạng đều huấn luyện trong một trò chơi đối nghịch, trong đó một mạng cố gắng tạo ra dữ liệu mới trong khi mạng kia cố gắng đoán xem dữ liệu đầu ra là dữ liệu sai hay dữ liệu thực.

Về mặt kỹ thuật, mạng đối nghịch tạo sinh GAN hoạt động như sau:

  • Mạng nơron của trình tạo kiểm tra tập huấn luyện để xác định các thuộc tính dữ liệu.
  • Mạng nơ-ron phân biệt đối xử đánh giá dữ liệu huấn luyện ban đầu và phân biệt giữa các thuộc tính một cách độc lập.
  • Mạng tạo ảnh hưởng đến chất lượng dữ liệu khác nhau bằng cách đưa ra nhiễu (hoặc thay đổi ngẫu nhiên) cho các thuộc tính cụ thể.
  • Mạng tạo sửa đổi dữ liệu và gửi nó đến mạng phân biệt đối. 
  • Mạng phân biệt xác định xem đầu ra có khớp với tập dữ liệu gốc hay không.
  • Mạng phân biệt hướng dẫn bộ tạo giảm ngẫu nhiên vectơ nhiễu trong chu kỳ tiếp theo.

Mạng tạo cố gắng tối ưu hóa xác suất lỗi của mạng phân biệt, trong khi mạng phân biệt đối xử cố gắng giảm khả năng xảy ra lỗi. Trong quá trình lặp lại đào tạo, mạng tạo và mạng phân biệt liên tục tiến hóa và đối mặt với nhau cho đến khi chúng đạt được trạng thái cân bằng. Ở trạng thái cân bằng, mạng phân biệt không còn nhận ra dữ liệu tổng hợp. Tại thời điểm này, việc đào tạo đã hoàn tất.

Các loại mạng đối nghịch tạo sinh GAN

1. GAN đơn thuần

GAN đơn thuần là một mô hình GAN cơ bản nhất, bao gồm hai phần chính là mạng tạo sinh và mạng phân biệt. Mạng tạo sinh nhận dữ liệu ngẫu nhiên và tạo ra dữ liệu mới, trong khi mạng phân biệt nhận dữ liệu thực và dữ liệu được tạo ra và cố gắng phân biệt chúng. Quá trình huấn luyện GAN đơn thuần diễn ra thông qua việc cải thiện khả năng tạo ra dữ liệu mới của mạng tạo sinh và khả năng phân biệt giữa dữ liệu thực và dữ liệu được tạo ra của mạng phân biệt.

2. GAN có điều kiện

GAN có điều kiện là một biến thể của GAN đơn thuần, nơi mà mạng tạo sinh và mạng phân biệt nhận thêm thông tin điều kiện để tạo ra dữ liệu mới và phân biệt dữ liệu. Điều kiện này có thể là bất kỳ thông tin nào mà người dùng muốn mô hình tạo ra, chẳng hạn như loại hình ảnh, âm thanh, hoặc văn bản cụ thể.

3. GAN tích chập sâu

GAN tích chập sâu là một loại GAN được thiết kế đặc biệt để xử lý dữ liệu hình ảnh. Mạng tạo sinh và mạng phân biệt trong GAN tích chập sâu sử dụng các lớp tích chập để trích xuất đặc trưng từ dữ liệu hình ảnh và học cách tạo ra và phân biệt ảnh mới.

4. GAN siêu phân giải

GAN siêu phân giải là một loại GAN được sử dụng để tạo ra ảnh có độ phân giải cao từ ảnh có độ phân giải thấp. Mạng tạo sinh trong GAN siêu phân giải học cách tạo ra các chi tiết nhỏ trong ảnh, trong khi mạng phân biệt học cách phân biệt giữa ảnh có độ phân giải cao và ảnh có độ phân giải thấp.

Mạng đối nghịch tạo sinh GAN đã và đang tạo ra sự chấn động trong lĩnh vực trí tuệ nhân tạo và có tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau. Từ việc tạo ra ảnh giả đến việc tạo ra âm thanh và video mới, GAN đang mở ra những cánh cửa mới cho sự sáng tạo và ứng dụng công nghệ trong cuộc sống hàng ngày.

TAGS: GAN
SHARE