Thật ra có thể phát triển bài toán theo kiểu detect porn + detect child thì sẽ làm được kiểu detect child in porn. Nhưng mà đến lúc test vẫn sẽ cần data thật. Mà train bằng data thật bao giờ cũng ra đc kết quả tốt hơn là làm kiểu kia
Vậy nó mới rất khó, và chỉ mấy công ty có nhiều người giỏi mới làm được. Nhưng nếu các bạn biết Ian Goodfellow là Director bên Apple thì thực chất họ vẫn có thể dùng (chủ yếu) là dữ liệu giả được tạo ra thông qua công nghệ GAN. Nhưng dữ liệu thật bắt buộc phải có. Mấy thứ bạn tìm được trên .Onion thì họ cũng tìm được, nhưng vấn đề pháp lý nên không phải cứ thế lấy huấn luyện. Ngoài ra, để huấn luyện mà không cần dữ liệu gốc hoặc đảm bảo tính riêng tư thì hiện có một số thuật toán và công nghệ đã được giới thiệu (tham khảo từ khoá: mupti-party computation, differential privacy, federated learning ..) nhưng vẫn còn nhiều hạn chế. Đây cũng là mấy thứ mà Google hay Facebook vẫn thường đề cập khi nói về việc họ vẫn đảm bảo riêng tư cho người dùng khi sử dụng dữ liệu của họ quảng cáo. Cái mà mấy ông vẫn chửi suốt đấy.
Làm j có quyền riêng tư khi dùng iphone nhể . Hệ thống can thiệp hết luôn mà . Sống chung với lũ thôi