AI cảm nhận cảm xúc đã có ở đây và nó có thể có mặt trong cuộc phỏng vấn xin việc tiếp theo của bạn

Tôi nhớ rất rõ lần đầu tiên tôi đã chứng kiến ​​công nghệ nhận dạng giọng nói hoạt động. Đó là vào giữa những năm 1990 trên một máy tính Macintosh trong lớp học ở trường cấp ba của tôi. Nhà văn khoa học viễn tưởng Arthur C. Clarke đã từng viết rằng “bất kỳ công nghệ tiên tiến nào đều không thể phân biệt được với ma thuật” – và điều này thật kỳ diệu khi nhìn thấy các từ được nói xuất hiện trên màn hình mà không cần bất kỳ ai phải đập mạnh chúng trên bàn phím.

Sau vài thập kỷ nữa, và hiện tại, một số lượng lớn (và đang tăng nhanh) các thiết bị của chúng tôi có các trợ lý AI như Siri của Apple hoặc Alexa của Amazon. Những công cụ này, được xây dựng bằng công nghệ trí tuệ nhân tạo mới nhất, không chỉ đơn giản là có thể phiên âm các từ – chúng có thể hiểu nội dung của chúng để thực hiện các hành động.

Nhưng giọng nói có thể làm được nhiều hơn thế. Một trong những lý do khiến các công cụ như Zoom ngày càng phổ biến trong thời kỳ đại dịch là sắc thái mà giọng nói mang lại. Chúng ta có thể truyền tải hầu hết mọi thông tin bằng giọng điệu của mình thông qua những từ ngữ mà chúng ta chọn.

Tuy nhiên, phần lớn, các công cụ nhận dạng giọng nói thế hệ hiện tại bỏ qua điều này. Nemesysco, một công ty công nghệ của Israel chuyên phát hiện cảm xúc dựa trên giọng nói, muốn sửa sai. Khi làm như vậy, nó có thể đưa công nghệ nhận dạng giọng nói lên một tầm cao mới, tạo ra tính năng nhận dạng giọng nói thông minh không chỉ hiểu chúng ta mà còn thực sự hiểu chúng ta. Nó tin rằng điều này có thể làm cho các trợ lý thông minh của ngày mai trở nên thông minh hơn, đưa ra những cách tương tác mới với thế giới và thậm chí có khả năng giúp quyết định xem bạn có được thăng chức trong công việc tiếp theo mà bạn mong muốn hay không.

Hãy sẵn sàng cho thế giới của “máy tính nhạy cảm”.

Che giấu cảm xúc của bạn

Tôi đang cảm thấy căng thẳng. Trên thực tế, điều đó không nói lên toàn bộ câu chuyện. Tôi cảm thấy căng thẳng, vui vẻ, hung hăng, buồn bã và tràn đầy năng lượng – cũng như đam mê, hạnh phúc, gắn bó, do dự, khó chịu, buồn bã và gần như chắc chắn là một số cảm xúc khác mà Amir Liberman, người sáng lập và Giám đốc điều hành của Nemesysco, đã trải qua. t đã được đo lường. Một số cảm xúc này dễ nhận thấy hơn những cảm xúc khác. Trong một số trường hợp, chúng to, rộng và ồn ào. Ở những người khác, chúng là những nguyên tố vi lượng yên tĩnh hơn tương tự như hạt đậu phộng nhỏ, tình cờ mà bạn có thể tìm thấy trong một gói khoai tây chiên. Nhưng chúng vẫn ở đó trên màn hình, bật lên và xuống như tần số âm thanh bass và treble trên một dàn hi-fi.

Liberman không chính xác đưa tôi qua máy vắt sổ. Anh ấy chỉ yêu cầu tôi cho anh ấy biết những gì tôi đã làm trong ngày cho đến nay: Một buổi sáng khá điển hình bao gồm việc con gái 3 tuổi của tôi đánh thức ngay trước sáu giờ, ăn sáng, giúp cô ấy mặc quần áo và dọn dẹp, đưa cô ấy đi chăm sóc ban ngày, dành nửa giờ để trả lời email, sau đó bắt đầu cuộc gọi để trò chuyện về AI đánh hơi cảm xúc

Không giống như công nghệ khai thác cảm xúc, ví dụ, kết hợp các nguồn cấp dữ liệu Twitter để xác định phản ứng cảm xúc quy mô lớn của mọi người đối với các sự kiện tin tức lớn, mọi thứ Nemesysco làm khi định lượng cảm xúc đều dựa trên âm thanh giọng nói của người nói. Bạn có thể đang nói về một buổi sáng thứ Năm không bình thường hoặc một ngày tồi tệ nhất trong cuộc đời bạn; điều quan trọng không phải là những điều bạn nói mà là cách bạn nói chúng. Ít nhất theo giai thoại, nó cũng có vẻ hoạt động. Trong khi tôi cố gắng nói đều (và, như đã lưu ý, buổi sáng của tôi không hoàn toàn bao gồm kịch tính), các chỉ số sinh học nhỏ về căng thẳng, giải trí và các chỉ số khác tăng đột biến ở những điểm mà bạn có thể mong đợi chúng trong cuộc độc thoại của tôi.

Theo Liberman, giọng nói chứa – hoặc ít nhất, AI Phân tích giọng nói phân lớp của Nemesysco có thể trích xuất – 51 thông số, sau đó có thể được tách biệt và liên kết, rộng ra, với 16 cảm xúc. “Điểm độc đáo ở chúng là tất cả chúng đều không bị kiểm soát, chúng đều tinh tế,” anh nói với Digital Trends. “Và tất cả chúng đều liên quan đến những cảm xúc thực sự, không phải những cảm xúc mà chúng tôi cố gắng phát sóng.”

Từ máy phát hiện nói dối đến 11.025 điểm dữ liệu

Nemesysco bắt đầu xây dựng công cụ nhận dạng giọng nói phát hiện cảm xúc của mình 24 năm trước như một máy phát hiện nói dối để lực lượng an ninh sử dụng. “Chưa bao giờ có ý định kiếm một xu từ nó,” Liberman viết cho tôi trong một email vài ngày sau khi chúng tôi nói chuyện. “Ý tưởng là xây dựng một máy phát hiện nói dối sẽ dễ sử dụng ở các cửa ra vào của Israel để ngăn chặn khủng bố.”

cảm nhận cảm xúc ai phân tích giọng nói nemesysco hồ sơ cảm xúc hậu xử lý

cảm xúc cảm nhận ai phân tích giọng nói nemesysco hồ sơ cảm xúc 2

Vào thời điểm đó, ý tưởng giải quyết vấn đề này bằng AI đã bị chế giễu rộng rãi. “Khi chúng tôi bắt đầu, AI là một từ tồi tệ,” anh nhớ lại. “Khi tôi nói,“ chúng ta sẽ sử dụng AI và cảm xúc, ”mọi người nói với tôi,“ Dù bạn làm gì, đừng đề cập đến AI ”…“ Phi lý trí ”là một trong những cái tên [đẹp hơn] mà tôi được gọi.”

Công nghệ của Nemesysco kể từ đó đã mở rộng ra ngoài tiền đề nhị phân “sự thật hay nói dối” mà nó được thành lập. Nhưng một số khái niệm về việc tìm kiếm sự thật, về việc thăm dò trước sự tinh tế của lời nói để tìm ra những mẫu giọng không thể nhận thấy mà mọi người thậm chí không biết rằng họ đang trưng bày vẫn còn. “Khi bạn nói về cảm xúc trong giọng nói, có một sự khác biệt rất quan trọng giữa những gì chúng ta cố gắng phát đi và những gì chúng ta thực sự cảm thấy bên trong,” Liberman nói. “Chúng tôi không cắt và khô khan: chúng tôi cố gắng che giấu giọng nói và cảm giác của mình trong nhiều trường hợp.”

Một người thường đấu tranh để xác định cảm xúc trên một dạng sóng. Hệ thống của Nemesysco sử dụng tốc độ lấy mẫu 11Khz, dẫn đến 11.025 điểm dữ liệu được tạo ra mỗi giây. Tìm kiếm cảm xúc trong vũng lầy của các điểm dữ liệu cũng giống như mò kim đáy bể. Đối với một số cảm xúc “cơ bản”, “nếu bạn biết nơi để tìm, bạn có thể đưa ra các ước tính trong đầu”, ông nói. “Tất nhiên PC làm điều đó tốt hơn và nhanh hơn nhiều.” Đối với hầu hết các cảm xúc, AI học máy là bắt buộc. Như Liberman đã lưu ý: “Chúng tôi sử dụng máy học để xác định sự hung hăng, nỗi buồn, hạnh phúc. Đây là những cảm xúc rất phức tạp, xét về mức độ phức tạp trong tâm trí. Rất khó [đối với chúng tôi ban đầu] tìm thấy chúng ”.

“Một chiếc điện thoại thực sự là bạn của bạn”

Ý tưởng cung cấp khả năng cảm nhận cảm xúc cho máy móc là ý tưởng đã được các nhà văn khoa học viễn tưởng khám phá từ lâu. Lấy một nhân vật như Data, người máy từ Star Trek:The Next Generation: Dù anh ta có kho thông tin hữu ích đến đâu, anh ta cũng phải trải qua những thử thách giao tiếp với nhóm Enterprise ngay từ đầu vì anh ta không hiểu một số sắc thái hành vi của con người .

Một phần lớn lời hứa về trí tuệ nhân tạo thực sự được xây dựng dựa trên khái niệm có thể mô hình hóa hoặc mô phỏng khả năng nhận thức của con người. Không có khả năng nhận thức nào của con người hơn là thể hiện cảm xúc. Có thể cấp cho máy móc khả năng cảm nhận được cảm xúc không giống như việc tạo ra cảm xúc cho chính máy móc. Công nghệ đánh hơi cảm xúc có thể giúp chúng ta hiểu rõ hơn về bản thân, có khả năng tạo ra kỳ tích khó khăn trong việc cung cấp cho chúng ta dữ liệu khách quan, thay vì chủ quan, về cảm xúc. “Nếu bạn không thể đo lường nó, bạn không thể quản lý nó,” như câu nói cổ.

Trong một số trường hợp, có thể hiểu được trạng thái cảm xúc của người dùng có thể giúp công nghệ hoạt động trực quan hơn – hoặc có lẽ an toàn hơn. “Tôi thực sự tin tưởng rằng việc đưa ra quyết định AI mà không tính đến trạng thái cảm xúc và tính cách của tôi sẽ không bao giờ tốt bằng [làm điều đó với suy nghĩ],” Liberman nói.

Anh ấy đưa ra các ứng dụng tiềm năng: Một robot giúp con bạn giải trí trong khi theo dõi tình trạng sức khỏe của chúng; một ứng dụng giúp bạn tối ưu hóa tâm trạng để tập trung vào mục tiêu của mình; ô tô có chế độ lái tự động giới hạn tốc độ của bạn hoặc bẻ lái khi biết bạn đang căng thẳng. “Hãy nghĩ về một chiếc điện thoại thực sự là bạn của bạn,” anh ấy viết cho tôi.

Thăng chức tiếp theo của bạn

Ngay bây giờ, một động lực lớn đối với công ty là việc sử dụng công nghệ Nemesysco để có thể giúp quyết định việc thăng chức cho mọi người. Công ty có một dự án nghiên cứu chung với Khoa Tâm lý học tại Đại học Tổng hợp Lomonosov Moscow của Nga nhằm “thiết lập các phương pháp định lượng để đo lường phẩm chất năng khiếu và năng lực cá nhân của các ứng viên và nhân viên đang được xem xét thăng chức, bao gồm căng thẳng, động lực, làm việc nhóm, khả năng lãnh đạo và nhiều hơn nữa.”

Ý tưởng bị từ chối xin việc vì giọng nói của chúng ta cho thấy chúng ta đã sai vì điều đó nghe thật đáng sợ.

Phương pháp thử nghiệm gần đây đã được áp dụng cho sáng kiến ​​tái cấu trúc doanh nghiệp của một công ty công nghiệp lớn ở Nga. Là một phần của sáng kiến, tiếng nói của ít hơn 300 giám đốc điều hành và quản lý cấp cao, tất cả đều được thăng chức, đã được phân tích trong các cuộc thảo luận với nhóm nhân sự của công ty, cũng như các câu trả lời bằng lời nói cho một bảng câu hỏi. Bài kiểm tra kết luận rằng khoảng 28% ứng viên được đánh giá về khả năng được thăng chức là không phù hợp và sẽ gặp khó khăn trong việc đương đầu với nhiệm vụ mới của họ.

Ý tưởng bị từ chối xin việc vì giọng nói của chúng ta cho thấy chúng ta đã sai vì điều đó nghe thật đáng sợ. Liberman cho biết nó không đơn giản như vậy. Ý tưởng không phải là giọng nói của một người quyết định khả năng họ được thăng chức, mà đó là một trong nhiều yếu tố có thể thông báo cho một quyết định như vậy. Trong một cuộc phỏng vấn, một người có thể được hỏi về kinh nghiệm cuối cùng của họ khi quản lý một nhóm người trong một bối cảnh nhất định. Nếu giọng nói của họ bộc lộ sự nhiệt tình và tự tin khi họ kể lại câu chuyện, điều đó có thể cho thấy sự phù hợp. Nếu tín hiệu thanh âm của họ cho thấy sự run rẩy và khó chịu, điều đó có thể có ý nghĩa ngược lại.

Ông nói: “Bằng cách gom những cảm xúc này vào một báo cáo, chúng tôi có thể nói một trong những điều bạn thích làm và những điều bạn không muốn làm.

Các bức thư ở khắp mọi nơi

Năm 1967, một nhà khoa học và nhà phát minh người Áo tên là Manfred Clynes đã chế tạo ra một chiếc máy đo cảm xúc. Clynes, một thần đồng từng nhận được một bức thư của người hâm mộ từ Albert Einstein về việc chơi piano của cậu ấy, đã gọi nó là “bức ảnh gửi” theo tên từ trong tiếng Latinh sentire , có nghĩa là “cảm nhận”. Máy chụp ảnh đo những thay đổi trong áp suất hướng được áp dụng cho một nút mà một người có thể nhấn. Được biết, một lần bấm ngón tay có thể tiết lộ sự tức giận, tôn kính, tình dục, niềm vui và nỗi buồn. Kết quả được công bố trong một cuốn sách năm 1976 của Clynes có tên là Sentics .

Cũng như nhiều người tiên phong, công việc của Clynes về chủ nghĩa tình cảm không nhiều trong suốt cuộc đời của ông. Tuy nhiên, ngày nay, lĩnh vực “máy tính tình cảm” đang tiếp tục phát triển. Các nhà nghiên cứu khẳng định rằng họ có thể dự đoán chính xác các trạng thái cảm xúc dựa trên nét mặt, nhịp tim, huyết áp, thậm chí cả việc sử dụng ứng dụng và hồ sơ điện thoại. Và, tất nhiên, giọng nói.

Một trong những lĩnh vực phức tạp hơn để điều hướng trong thế giới công nghệ cảm nhận cảm xúc mới đầy dũng cảm này sẽ là đảm bảo độ chính xác. Theo cách này, nhận dạng giọng nói tương đối đơn giản. Một công cụ đọc chính tả hoặc đọc các từ được nói với nó hoặc không. Ý tưởng giải nén những cảm xúc mà ngay cả người dùng cũng không nhận ra rằng họ đang truyền tải là một thử thách hơn. Có một lý do tại sao máy phát hiện nói dối không được chấp nhận tại tòa án. Đảm bảo rằng các công cụ này hoạt động và không bị sai lệch phải là ưu tiên hàng đầu.

Theo Liberman, tất cả mọi người đều có cùng một cảm giác giọng nói mà hệ thống của họ đang tìm kiếm. Có, một bản chào hàng cho công ty lưu ý, “không có thành kiến ​​về tuổi tác, giới tính hoặc sắc tộc.” Liberman nói với tôi rằng đó là “đa văn hóa, là giao thoa giữa các dân tộc, mọi người đều giống nhau.” Điều này rất quan trọng, đặc biệt là khi các công cụ này vượt ra ngoài các dự án nghiên cứu trong phòng thí nghiệm và vào ngày càng nhiều lĩnh vực trong cuộc sống của chúng ta.

AI bằng giọng nói được đào tạo với những người thật tạo ra phản ứng cảm xúc chân thực. “Không có gì trong nghiên cứu của chúng tôi được thực hiện về giọng giả,” ông nói. “Không có gì. Mọi thứ chúng tôi đã làm, mọi mô hình chúng tôi xây dựng, đều dựa trên những cảm xúc có thật được thu thập trong các tình huống thực tế ”.

AI theo dõi cảm xúc sắp ra mắt. Tương tự như cách mà nhận dạng giọng nói – từng là một giấc mơ khoa học viễn tưởng, được thực hiện một cách siêng năng trong một vài phòng nghiên cứu cao cấp – hiện đã được tìm thấy trên điện thoại của chúng ta, vì vậy AI cũng sẽ trở thành một vật cố định trong cuộc sống hàng ngày của chúng ta. Đó là, nếu nó chưa có.

AI biết được: Nó thậm chí có thể giúp bạn bật đèn xanh cho sự thăng tiến lớn trong sự nghiệp tiếp theo của bạn.

Môn học mạnh về khả năng vận dụng phương pháp để ứng phó với công việc, cuộc sống chính là PHƯƠNG PHÁP LUẬN SÁNG TẠO và ĐỔI MỚI. Đây là chìa khoá để tiếp cận với các nguyên tắc thủ thuật giúp tư duy có nền tảng và định hướng hơn. Tại Trung tâm Sáng tạo Khoa học–kỹ thuật (TSK) thuộc trường Khoa Học Tự Nhiên là một nơi đáng tin cậy để bạn theo học. Bạn có thể điền thông tin tại đây hoặc liên hệ số điện thoại: (028) 38 301 743; 089 668 36 31 để thực hiện đăng ký.

Nguồn: DigitalTrends

You may also like...