Đi kèm với đó là hoạt động giao dịch ngầm về mọi loại dữ liệu, từ nhật ký trò chuyện đến ảnh cá nhân bị “lãng quên” từ lâu trên các diễn đàn, mạng xã hội cổ xưa.
Luật sư Edward Klaris từ Klaris Law cho biết những gã khổng lồ công nghệ đang sốt sắng tìm kiếm những người nắm bản quyền dữ liệu của những “nội dung riêng tư mà không thể loại bỏ” trong quá trình thu thập dữ liệu và huấn luyện AI. Hãng luật này đang tư vấn cho một số khách hàng mua bản quyền nội dung và cấp phép lưu trữ ảnh, phim, sách phục vụ đào tạo AI với giá hàng chục triệu USD.
Business Research Insightsước tính giá trị thị trường mua bán dữ liệu cho AI hiện ở mức 2,5 tỷ USD và sẽ tăng lên 30 tỷ USD trong vòng một thập kỷ.
Meta, Google, Amazon và Apple đều có thoả thuận với nhà cung cấp hình ảnh Shutterstock. Nguồn tin của Reuterscho hay, giá trị các hợp đồng rơi vào khoảng từ 25 triệu USD đến 50 triệu USD. Những công ty AI nhỏ hơn cũng không đứng ngoài cuộc chơi khiến chợ dữ liệu càng thêm nhộn nhịp suốt hai tháng qua.
Freepik, đối thủ của Shutterstock, cũng cho biết họ có thoả thuận với hai công ty công nghệ lớn, cấp phép phần lớn kho lưu trữ 200 triệu hình ảnh với mức giá từ 0,02 USD đế 0,04 USD mỗi hình ảnh. CEO Joaquin Cuenca Abela tiết lộ còn có thêm 5 giao dịch tương tự nhưng từ chối tiết lộ danh tính bên mua.
OpenAI, một trong những khách hàng đầu tiên của Shutterstock, cũng đã ký thoả thuận cấp phép với ít nhất bốn tổ chức xuất bản tin tức bao gồm AP, Axel Springer và Thomson Reuters.
Ngành công nghiệp dữ liệu AI
Ngành công nghiệp dữ liệu AI chuyên dụng đang dần định hình. Defined.ai, trụ sở Seattle đang cấp phép dữ liệu cho một loạt công ty bao gồm Google, Meta, Apple, Amazon và Microsoft.
Giá cả khác nhau tùy theo người mua và loại nội dung, nhưng CEO Daniela Braga cho biết các công ty thường sẵn sàng trả từ 1 đến 2 USD cho mỗi hình ảnh, 2 đến 4 USD cho mỗi video dạng ngắn và 100 đến 300 USD mỗi giờ cho phim dài hơn. Trong khi đó, giá thị trường cho văn bản là 0,001 USD mỗi từ.
Defined.ai cho biết, các tập dữ liệu “có nguồn gốc hợp pháp” do có sự đồng ý từ những người chủ sở hữu và đã loại bỏ thông tin nhận dạng cá nhân. Công ty cũng chia sẻ khoản thu nhập với các nhà cung cấp nội dung. Sau đó, các nhà cung cấp nội dung trả chủ sở hữu bản quyền 20-30% tổng giá trị giao dịch.
Theo một nhà cung cấp dữ liệu trụ sở Brazil, những hình ảnh đắt giá nhất trong danh mục thường là hình ảnh đào tạo hệ thống AI chặn nội dung bạo lực. Do đó, công ty thu thập hình ảnh về hiện trường vụ án, bạo lực và các cuộc phẫu thuật chủ yếu từ cảnh sát, phóng viên ảnh tự do và sinh viên y khoa ở những khu vực như Nam Mỹ và châu Phi.
Rủi ro quyền riêng tư người dùng
Các chuyên gia nhận định, việc đưa những "tên tuổi Internet cũ" như Photobucket trở lại, sử dụng nội dung làm nhiên liệu cho đào tạo AI có thể gây ra một số rủi ro nghiêm trọng, đặc biệt về quyền riêng tư của người dùng.
"Có nghĩa là, những bức ảnh hoặc nội riêng tư của một người được đăng cách đây vài thập kỷ có thể xuất hiện trở lại trong kết quả đầu ra của AI mà không cần thông báo hoặc có sự đồng ý rõ ràng", một chuyên gia cho biết.
Braga của Defined.ai cho biết công ty tránh mua nội dung từ các đơn vị mang tính "nền tảng" như Photobucket. Thay vào đó, công ty lấy nguồn ảnh trên mạng xã hội do KOL tạo ra - những người có yêu cầu rõ ràng hơn về quyền cấp phép.
"Tôi thấy lấy nội dung từ nền tảng cũ rất rủi ro", Braga nói. "Nếu có AI nào đó tạo ra thứ gì đó giống với hình ảnh của một người chưa bao giờ đồng ý chia sẻ, đó là một vấn đề".
Photobucket không phải là nền tảng cũ duy nhất bán nội dung cho công ty AI. Automattic, công ty mẹ của Tumblr, tháng trước cũng cho biết đang chia sẻ nội dung với "công ty AI được chọn lọc". Trong tháng 2, Reddit cũng đạt được thỏa thuận với Google về việc huấn luyện AI.
Dù vậy vào tháng 3, Reddit nói quyết định cấp phép dữ liệu cho bên thứ ba đào tạo AI khiến công ty trở thành mục tiêu điều tra của Ủy ban Thương mại Liên bang Mỹ. Mạng xã hội thừa nhận rằng hành vi này có thể vi phạm các quy định về quyền riêng tư và sở hữu trí tuệ đang có
![]() | ![]() | ![]() |
Người đẹp hy vọng ông xã đồng cảm công việc, đồng hành cùng mình vượt qua những thăng trầm của cuộc sống. "Tôi nghĩ bản thân đủ kiên nhẫn, sức khỏe để sẵn sàng lập gia đình trong thời gian tới", cô tâm sự.
![]() | ![]() |
Năm 2019, ca sĩ Tronie bất ngờ công khai chuyện tình cảm với MC Kiều Ngân sau 2 năm hẹn hò bí mật. Phía nam ca sĩ cho biết sau thời gian tìm hiểu, cặp đôi đã có dự tính về kế hoạch lâu dài. Tronie muốn công khai chuyện tình cảm vào dịp Valentine để tạo dấu mốc đáng nhớ nhất cho mối tình.
Kiều Ngân hạnh phúc bên Tronie Ngô:
Diệu Thu
Sách nói và bài toán bản quyền
Một trong những khó khăn lớn nhất khi Viettel chinh phục thị trường sách nói là tìm kiếm nguồn nội dung cho MyDio. Cũng như nhiều công ty phát triển sách nói khác, sách lậu, sách vi phạm bản quyền vẫn đang là “bài toán khó” đối với Viettel.
Chia sẻ về hoạt động trong lĩnh vực cung cấp các sản phẩm sách nói trên Internet, ông Nguyễn Trọng Tính - Phó Tổng Giám đốc Viettel Telecom - đơn vị phát triển ứng dụng MyDio chia sẻ: “Lĩnh vực nội dung số nói chung đều “dính” câu chuyện vi phạm bản quyền và các nền tảng lậu. Tìm kiếm từ khóa “sách nói” trên Internet sẽ thấy có hàng trăm, hàng nghìn web, wap có nội dung vi phạm bản quyền, thậm chí cả những đầu sách rất “hot”. Đấu tranh chống vi phạm bản quyền còn là câu chuyện dài. Chúng tôi sẽ sử dụng các công cụ, công nghệ để bảo vệ bản quyền nội dung số của mình cũng như các nhà cung cấp nội dung số có bản quyền chính thức. Là nhà cung cấp dịch vụ Internet trên nền tảng cố định và di động, chúng tôi hoàn toàn có thể chặn được các nội dung vi phạm bản quyền, tuy nhiên, việc chặn cũng phải phù hợp với hành lang pháp lý, phải có sự tham gia đấu tranh của nhiều cơ quan, bộ, ngành khác nữa thì mới làm được. Chúng tôi sẽ đề xuất lên Cục Xuất bản – In và Phát hành thuộc Bộ Thông tin và Truyền thông để đưa ra hành lang pháp lý cho vấn đề này. Rất mong công chúng độc giả nâng cao nhận thức về bảo vệ bản quyền nội dung số, chỉ sử dụng những sản phẩm/nền tảng hợp pháp”.
Viettel “bắt tay” Alpha Books phát triển kho sách nói có bản quyền trên môi trường số
Ngày 10/9/2024, Tổng công ty Viễn thông Viettel đã chính thức ký kết hợp tác chiến lược với Công ty cổ phần Alpha Books nhằm thúc đẩy thị trường sách nói tại Việt Nam thông qua phát triển ứng dụng đọc sách MyDio.
Theo thoả thuận hợp tác giữa Viettel và Alpha Books, Viettel với vị thế là doanh nghiệp hàng đầu về công nghệ thông tin và viễn thông, cam kết không ngừng cải tiến và phát triển công nghệ mới trên nền tảng sách nói MyDio, đảm bảo vận hành ổn định để độc giả có những trải nghiệm tốt nhất. Điều này sẽ tạo nên những tác động tích cực giúp lan toả văn hoá đọc mạnh mẽ tới cộng đồng khi nhu cầu đọc sách đang ngày một tăng cao.
Ông Nguyễn Trọng Tính, Phó Tổng Giám đốc Viettel Telecom khẳng định: “Chúng tôi luôn sẵn sàng đầu tư vào công nghệ, con người và hệ thống để mang lại những trải nghiệm sách nói hoàn hảo nhất. Trong tương lai, Viettel sẽ cung cấp các công cụ AI hỗ trợ các nhà xuất bản, nhà phát hành sách, đối tác có thể chủ động sản xuất sách nói, truyện audio một cách nhanh chóng và tiết kiệm chi phí”.
Sự hợp tác giữa Viettel và Alpha Books mở ra nhiều tiềm năng hứa hẹn cho sự phát triển của thị trường sách nói tại Việt Nam khi một bên sở hữu công nghệ và nền tảng, một bên có nguồn nội dung và tri thức dồi dào. Theo thoả thuận hợp tác, Viettel và Alpha Books đặt mục tiêu sẽ tiếp cận 8-10 triệu khách hàng trong 5 năm tới.
Trong đó, việc ứng dụng AI để mở rộng thị trường sách nói, lan tỏa văn hóa đọc trên không gian mạng được xem là nội dung hợp tác quan trọng trong thỏa thuận này.
Ứng dụng trí tuệ nhân tạo vào sách nói: Bước nhảy vọt giúp tối ưu trải nghiệm của độc giả
Việc đẩy mạnh ứng dụng công nghệ AI sẽ góp phần gia tăng lợi thế cạnh tranh đáng kể cho sách nói MyDio. Ứng dụng công nghệ AI, thời gian sản xuất sách nói giờ đây chỉ còn 15 phút/đầu sách (giảm tới 40 lần so với trước đây), giúp Viettel tiết kiệm 98% chi phí. Ngoài ra, giọng đọc AI cũng được đội ngũ Viettel phát triển, điều chỉnh tùy theo thể loại sách, mang lại cảm giác tự nhiên và chân thật như con người. Điều này khiến cho nội dung của sách nói được truyền tải dễ dàng và hấp dẫn hơn tới người nghe.
Thêm vào đó, công nghệ AI và Bigdata cũng giúp MyDio có thêm “điểm cộng” nhờ khả năng cá nhân hóa trải nghiệm người dùng. Ứng dụng hệ thống khuyến nghị nội dung số dựa trên trí tuệ nhân tạo (CCAI & RAS) vào việc cải thiện trải nghiệm của người dùng trên Mydio, sử dụng các công nghệ mới nhất về AI và dữ liệu lớn đưa ra các gợi ý nội dung số cá thể hóa người dùng, cùng với mô hình ngôn ngữ lớn, được áp dụng mạnh mẽ trong việc thúc đẩy và nâng cao trải nghiệm người dùng dịch vụ MyDio. Theo đó, MyDio gợi ý các đầu sách tùy theo sở thích, nhu cầu và trình độ của mỗi người, giúp họ dễ dàng tìm kiếm và tiếp cận những cuốn sách phù hợp trong hơn 10.000 nội dung có bản quyền hiện có trên ứng dụng. Hệ thống khuyến nghị nội dung và ứng dụng trí tuệ nhân tạo MyDio đạt giải đồng IT World Awards năm 2024 do Network Product Guide (Silicon Valley, Mỹ) trao tặng.
Nhờ lợi thế làm chủ công nghệ từ Viettel, sách nói MyDio hứa hẹn ngày một được phát triển và hoàn thiện với những tính năng vượt trội cho người sử dụng.
Hồng Nhung
" alt=""/>Viettel tiên phong bảo vệ bản quyền sách nói trên môi trường số