Khoa học Dữ liệu được đánh giá là “nghề hấp dẫn nhất thế kỷ 21”, theo Tạp chí Harvard Business Review. Tại Mỹ, Khoa học Dữ liệu đứng đầu trong số 25 nghề tốt nhất, đứng 16 về mức lương và đứng đầu trong số 10 ngành nghề được tuyển dụng nhiều nhất hiện nay.
Tại Việt Nam, Khoa học Dữ liệu cũng là một trong những ngành hot được đông đảo thí sinh quan tâm với nhiều hứa hẹn về cơ hội phát triển.
Năm 2024, Khoa Toán, Trường Đại học Sư phạm - Đại học Đà Nẵng (UED) chính thức tuyển sinh ngành Khoa học Dữ liệu.
Được biết trước đó, ngày 29/2/2024, Bộ Giáo dục và Đào tạo đã phê duyệt về việc cho phép Trường Đại học Sư phạm - Đại học Đà Nẵng đào tạo ngành Khoa học dữ liệu trình độ đại học từ năm 2024, mã số: 7460108, khoa Toán học.
Theo quy định tại Điều 4, Thông tư 02/2022/TT-BGDĐT (quy định điều kiện, trình tự, thủ tục mở ngành đào tạo, đình chỉ hoạt động của ngành đào tạo trình độ đại học, thạc sĩ, tiến sĩ), ngoài các điều kiện chung theo quy định tại Điều 3 Thông tư này, cơ sở đào tạo mở ngành đào tạo trình độ đại học phải đáp ứng các điều kiện theo quy định tại Điều 4 Thông tư này cho toàn bộ khóa học tại thời điểm nộp hồ sơ đề nghị mở ngành đào tạo.
Một số điều kiện quy định đáng chú ý như cần có ít nhất 01 tiến sĩ ngành phù hợp là giảng viên cơ hữu, không trùng với giảng viên cơ hữu là điều kiện mở ngành đào tạo trình độ đại học của các ngành khác.
Có ít nhất 05 tiến sĩ là giảng viên cơ hữu có chuyên môn phù hợp để chủ trì giảng dạy chương trình (tính cả tiến sĩ ngành phù hợp quy định tại khoản 1 Điều này), trong đó mỗi thành phần của chương trình đào tạo phải có giảng viên với chuyên môn phù hợp chủ trì giảng dạy.
Ngoài ra, còn các yêu cầu về cơ sở vật chất, kế hoạch, phương án đầu tư cơ sở vật chất, mua sắm thiết bị cho các năm học tiếp theo…
Trường Đại học Sư phạm - Đại học Đà Nẵng đáp ứng về các điều kiện mở ngành ra sao?
Bàn về các điều kiện đảm bảo chất lượng theo quy định mở ngành, Phó giáo sư, Tiến sĩ Phạm Quý Mười - Trưởng khoa Toán, Trường Đại học Sư phạm - Đại học Đà Nẵng (gọi tắt là Trường Đại học Sư phạm Đà Nẵng) cho biết, Khoa Toán học hiện nay có 25 giảng viên, trong đó có 03 phó giáo sư và 17 tiến sĩ tham gia vào giảng dạy các học phần của ngành Khoa học Dữ liệu.
“Đây là đội ngũ giảng viên trẻ và rất nhiều giảng viên được đào tạo tiến sĩ ở nước ngoài, có kinh nghiệm nghiên cứu về Khoa học dữ liệu và các vấn đề toán học liên quan đến lĩnh vực này. Bên cạnh đó, đội ngũ giảng viên của Khoa công nghệ thông tin của trường cũng tham gia vào quá trình đào tạo này”, Trưởng khoa Phạm Quý Mười thông tin.
Bên cạnh đó, về cơ sở vật chất, Phó giáo sư Mười chia sẻ nhà trường có cơ sở vật chất tương đối tốt với hệ thống công nghệ thông tin hiện đại và nhiều phòng máy tính phục vụ cho quá trình đào tạo.
“Hiện nay, nhà trường trường đã và đang triển khai nhiều văn bản hợp tác với các trường đại học/viện nghiên cứu trong và ngoài nước, đặc biệt là các công ty chuyên về Công nghệ thông tin.
Riêng đối với Khoa Toán, với việc xác định Khoa học dữ liệu là ngành đào tạo mũi nhọn, trong thời gian tới Khoa sẽ tiếp tục kết nối hợp tác thêm với các công ty và doanh nghiệp khác liên quan đến lĩnh vực này trên địa bàn Đà Nẵng nói riêng và khu vực miền Trung nói chung để tạo cơ hội cho sinh viên thực tập, trau dồi kỹ năng nghề nghiệp và tăng cường cơ hội việc làm sau khi tốt nghiệp”, Trưởng khoa Phạm Quý Mười chia sẻ thêm.
Được biết, để xây dựng chương trình đào tạo ngành Khoa học Dữ liệu, Trường Đại học sư phạm Đà Nẵng đã triển khai thực hiện theo quy trình mở mới ngành đào tạo, bao gồm nhiều bước, nhiều công đoạn, từ việc xin chủ trương mở ngành đến nghiên cứu thị trường và phân tích nhu cầu, xây dựng và lấy ý kiến các bên liên quan về mục tiêu, chuẩn đầu ra, khung chương trình đào tạo, cấu trúc chương trình đào tạo, đề cương chi tiết học phần, xác định đội ngũ, phát triển các tài liệu học tập và giáo trình, xây dựng cơ sở hạ tầng và trang thiết bị.
“Bằng cách thực hiện những bước trên một cách cẩn thận và toàn diện, nhà trường đã xây dựng được một Chương trình đào tạo đại học được đánh giá có chất lượng cao và phù hợp với nhu cầu của người học và thị trường lao động”, Trưởng khoa Phạm Quý Mười khẳng định.
Thời gian gần đây, kết luận thanh tra của Bộ Giáo dục và Đào tạo đã chỉ ra không ít trường đại học mở rồi lại đóng ngành chóng vánh. Bởi vậy, với những ngành học mới mở trong thời gian này càng nhận được sự chú ý lớn của dư luận.
Theo tìm hiểu của phóng viên, ngay trong khu vực Đà Nẵng, thậm chí trong chính hệ thống Đại học Đà Nẵng cũng đang đào tạo ngành Khoa học Dữ liệu, đơn cử như Trường Đại học Kinh tế – Đại học Đà Nẵng (DUE); Trường Đại học Công nghệ thông tin và truyền thông Việt Hàn – Đại học Đà Nẵng (VKU); Trường Đại học Đông Á; Ngành Khoa học Dữ liệu tại Viện nghiên cứu và đào tạo Việt – Anh (VNUK)...
Vậy bài toán về nguồn tuyển ngành Khoa học Dữ liệu với Trường Đại học Sư phạm Đà Nẵng được tính toán ra sao?
Trả lời vấn đề này, Phó Giáo sư Phạm Quý Mười đánh giá, trong những năm gần đây, nhiều trường đại học đều nhận thấy nhu cầu tuyển dụng ngành Khoa học Dữ liệu ngày càng lớn nên một số trường đã mở mới ngành này hoặc chuyển đổi tên ngành đào tạo hiện có thành ngành Khoa học Dữ liệu hoặc một phần nội dung liên quan đến Khoa học Dữ liệu. Vì Khoa học Dữ liệu là một ngành đa lĩnh vực nên mỗi chương trình đào tạo tập trung vào một hướng khác nhau.
"Từ năm 2021, Bộ Giáo dục và Đào tạo đã ban hành danh mục ngành đào tạo, trong đó xác định Khoa học Dữ liệu thuộc nhóm ngành toán.
Theo quy định, chỉ tiêu tuyển sinh được tính trên cơ sở các điều kiện đảm bảo chất lượng của cơ sở đào tạo như đội ngũ giảng viên và điều kiện cơ sở vật chất,… Và vì mới mở khoá đầu tiên nên chỉ tiêu là 45 (theo quy định). Những năm sau, chỉ tiêu tuyển sinh sẽ được tăng lên”, thầy Mười lý giải thêm.
Trưởng khoa Toán, Trường Đại học Sư phạm Đà Nẵng nhận định, kết quả tuyển sinh tùy thuộc vào thương hiệu nhà trường, uy tín và chất lượng đào tạo, trên cơ sở cạnh tranh giữa các trường cũng như các ngành đào tạo khác.
Chương trình đào tạo ngành Khoa học Dữ liệu của Trường Đại học Sư phạm Đà Nẵng
Khoa học dữ liệu được đánh giá là một lĩnh vực khá rộng, bởi vậy không ít thí sinh khi tìm hiểu về ngành học này cảm thấy khá bối rối và hoang mang.
Về vấn đề này, thầy Mười chia sẻ, chương trình đào tạo đại học ngành Khoa học Dữ liệu thường cung cấp cho sinh viên một loạt các kiến thức và kỹ năng để họ có thể làm việc hiệu quả trong lĩnh vực này. Dĩ nhiên, Khoa học Dữ liệu là một lĩnh vực rất rộng lớn và đa dạng, và đôi khi có thể cảm thấy khá phức tạp và không đồng nhất.
Tuy nhiên, vị trưởng khoa khẳng định, chương trình đào tạo Khoa học Dữ liệu của Trường Đại học Sư phạm Đà Nẵng được thiết kế để cung cấp một cơ sở kiến thức cơ bản và sâu sắc, tạo ra nhiều cơ hội nghề nghiệp cho sinh viên và cũng tập trung vào một số lĩnh vực cụ thể phù hợp với mục tiêu sự nghiệp của họ. Điều này giúp sinh viên có thể tạo ra một hướng đi riêng cho mình trong lĩnh vực đầy tiềm năng này.
Chia sẻ về chương trình đào tạo ngành Khoa học Dữ liệu dự kiến tuyển sinh năm nay, Phó giáo sư Phạm Quý Mười cho biết:
Chương trình đào tạo ngành Khoa học Dữ liệu của Khoa Toán, Trường Đại học Sư phạm Đà Nẵng có thời gian đào tạo 04 năm, được thiết kế và xây dựng nhằm trang bị cho người học 3 mảng kiến thức chính: Toán và Thống kê, Tin học, Học máy (Machine learning).
Người học sẽ được học lý thuyết kết hợp với thực hành phân tích dữ liệu trên các ngôn ngữ phổ biến như R và Python, viết và trình bày báo cáo nhằm trao dồi các kỹ năng nghề nghiệp.
“Đây là sự khác biệt lớn với một số chương trình đào tạo Khoa học Dữ liệu ở một số trường đại học khác hiện nay”, Phó giáo sư Mười khẳng định.
Khoa học Dữ liệu - Ngành học của thế kỷ 21
Theo Phó giáo sư Mười, dữ liệu đóng vai trò quan trọng trong nhiều lĩnh vực của cuộc sống hiện đại ngày nay, và khoa học dữ liệu đã mang lại nhiều ứng dụng hữu ích trong đó.
Lấy dẫn chứng minh họa cho thí sinh dễ hình dung hơn về ứng dụng của khoa học dữ liệu trong đời sống, Phó giáo sư Mười phân tích:
Đơn cử trong phân tích ngôn ngữ tự nhiên, công nghệ xử lý ngôn ngữ tự nhiên (NLP) trong Khoa học dữ liệu cho phép máy tính hiểu và tương tác với ngôn ngữ con người. Ứng dụng của NLP bao gồm tổng hợp tin tức, dự đoán tâm trạng công chúng trên mạng xã hội, và tạo ra các hệ thống trợ giúp thông minh như trợ lý ảo.
Trong quản lý tài nguyên và môi trường, Khoa học Dữ liệu được áp dụng để phân tích dữ liệu về tiêu thụ năng lượng, quản lý chất thải và dự đoán biến đổi khí hậu. Việc hiểu rõ hơn về mô hình tiêu thụ tài nguyên và ảnh hưởng của các hoạt động con người giúp tối ưu hóa sử dụng tài nguyên và giảm thiểu tác động tiêu cực đến môi trường.
Hay trong lĩnh vực chăm sóc sức khỏe thông minh, Khoa học Dữ liệu được sử dụng để phân tích dữ liệu bệnh lý và dữ liệu y tế cá nhân, từ đó đưa ra dự đoán về nguy cơ bệnh tật và tùy chỉnh phác đồ điều trị. Công nghệ này cũng giúp cải thiện quản lý bệnh tình, giảm thiểu sai sót trong chẩn đoán và tối ưu hóa chi phí chăm sóc sức khỏe.
Với lĩnh vực giao thông, dữ liệu từ cảm biến trên các phương tiện và hạ tầng giao thông được thu thập và phân tích để cải thiện việc quản lý luồng giao thông, dự báo ùn tắc và tai nạn giao thông, đồng thời tối ưu hóa hệ thống giao thông công cộng.
Phó giáo sư Mười bày tỏ, những ứng dụng trên chỉ là một phần nhỏ trong rất nhiều lĩnh vực mà Khoa học Dữ liệu đang có ảnh hưởng trong cuộc sống hiện đại ngày nay.
Về khái niệm, Trưởng khoa Phạm Quý Mười cho biết, ngành Khoa học Dữ liệu (Data Science) là một lĩnh vực đa ngành liên quan đến việc thu thập, xử lý, phân tích và trích xuất thông tin từ dữ liệu để đưa ra các quyết định thông minh và dự đoán trong một loạt các lĩnh vực. Khoa học Dữ liệu kết hợp các phương pháp từ khoa học máy tính, thống kê, toán học, và lĩnh vực liên quan khác để hiểu và sử dụng dữ liệu một cách hiệu quả.
“Với sự gia tăng về dữ liệu và sự phát triển của công nghệ, ngành Khoa học Dữ liệu có tiềm năng phát triển mạnh mẽ trong tương lai và đóng vai trò quan trọng trong nhiều lĩnh vực của cuộc sống hiện đại”, Phó giáo sư Mười khẳng định tiềm năng phát triển của ngành học “hot” này.
Sinh viên học ngành Khoa học Dữ liệu có rất nhiều cơ hội phát triển trong nhiều lĩnh vực khác nhau do ngành này được ứng dụng rộng rãi và có nhu cầu ngày càng tăng từ các doanh nghiệp và tổ chức.
Theo Phó giáo sư Mười, sinh viên tốt nghiệp ngành Khoa học Dữ liệu có thể theo đuổi công việc như:
Nhà phân tích dữ liệu (Data Analyst): Những người làm công việc này tập trung vào việc thu thập, phân tích và trình bày dữ liệu để hỗ trợ quyết định kinh doanh. Công việc của họ bao gồm xây dựng báo cáo, dự đoán xu hướng, và tìm kiếm thông tin quan trọng từ dữ liệu.
Kỹ sư dữ liệu (Data Engineer): Kỹ sư dữ liệu chịu trách nhiệm xây dựng và duy trì hạ tầng dữ liệu, bao gồm cơ sở dữ liệu, hệ thống lưu trữ và xử lý dữ liệu. Họ cũng phát triển các công cụ và quy trình để xử lý dữ liệu lớn và dữ liệu thời gian thực.
Nhà Khoa học Dữ liệu (Data Scientist): Đây là vị trí yêu cầu kỹ năng về thống kê, máy học và lập trình để phân tích dữ liệu phức tạp và đưa ra dự đoán. Nhà Khoa học Dữ liệu thường tham gia vào việc xây dựng mô hình dự đoán, tối ưu hóa thuật toán và hiểu sâu về dữ liệu.
Chuyên gia trích xuất thông tin (Information Retrieval Specialist): Chuyên gia này tập trung vào việc phát triển các hệ thống để tìm kiếm và trích xuất thông tin từ dữ liệu lớn. Công việc của họ có thể bao gồm phát triển các công cụ tìm kiếm web, hệ thống lọc thông tin, và hệ thống gợi ý.
Về thu nhập, Phó giáo sư Mười cho biết, thu nhập sinh viên tốt nghiệp ngành Khoa học Dữ liệu phụ thuộc vào nhiều yếu tố như kinh nghiệm làm việc, vị trí công việc, khu vực địa lý và ngành công nghiệp. Tuy nhiên, ngành này thường được coi là một trong những ngành có mức thu nhập cao, đặc biệt là khi có kỹ năng và kinh nghiệm chuyên môn. Các nghiên cứu và báo cáo thường cho thấy mức lương của những người làm việc trong lĩnh vực này ở mức trung bình hoặc cao hơn so với các ngành công nghiệp khác.
Theo tìm hiểu của thầy Mười, mức lương trung bình cho sinh viên tốt nghiệp ngành Khoa học Dữ liệu ở Việt Nam thường dao động từ 8 triệu đến 15 triệu đồng/tháng (~$350 - $650) tùy thuộc vào vị trí công việc, công ty, và kinh nghiệm. Các vị trí cao cấp như nhà khoa học dữ liệu hoặc kỹ sư dữ liệu ở các công ty công nghệ lớn hoặc doanh nghiệp nước ngoài có thể có mức lương cao hơn, có thể lên đến 30 triệu đồng/tháng hoặc hơn (~$1300+).
Mức lương trung bình cho sinh viên tốt nghiệp ngành Khoa học dữ liệu ở Mỹ thường cao hơn, dao động từ $60,000 đến $100,000 một năm. Các vị trí ở các công ty công nghệ lớn như Google, Facebook, Amazon hoặc các công ty tài chính có thể có mức lương cao hơn, thậm chí vượt quá $150,000 một năm hoặc hơn.
“Lưu ý, các con số này chỉ là ước lượng và có thể biến đổi tùy thuộc vào nhiều yếu tố khác nhau như vị trí, kỹ năng cá nhân, và chi phí sinh sống trong khu vực cụ thể”, vị Trưởng khoa nhấn mạnh.
Định hướng thêm cho sinh viên muốn theo đuổi ngành Khoa học Dữ liệu, Phó giáo sư Phạm Quý Mười cho rằng các bạn trẻ cần có những tố chất và kiến thức nhất định như sự đam mê và sự tò mò, muốn khám phá các thông tin ẩn trong dữ liệu, tìm hiểu về các phương pháp mới và công nghệ tiên tiến trong lĩnh vực này.
Bên cạnh đó, một số kiến thức, kỹ năng quan trọng khác cần có như kỹ năng phân tích và tư duy logic để hiểu và áp dụng các phương pháp và công cụ phân tích dữ liệu một cách hiệu quả; Kiến thức về toán học và thống kê để hiểu và áp dụng các phương pháp phân tích dữ liệu, xây dựng mô hình dự đoán và đánh giá kết quả; Kỹ năng lập trình và kiến thức về cơ sở dữ liệu; Kỹ năng giao tiếp và làm việc nhóm để làm việc với các đồng nghiệp và khách hàng, cũng như trong việc trình bày và giải thích các kết quả phân tích dữ liệu một cách rõ ràng và hiệu quả.
Phân biệt ngành Khoa học Dữ liệu với ngành Phân tích dữ liệu và Khoa học máy tính
Theo Phó giáo sư Phạm Quý Mười, Khoa học Dữ liệu là một ngành học tương đối mới và có độ phức tạp. Đây là một lĩnh vực đa ngành, kết hợp nhiều lĩnh vực khác nhau như thống kê, toán học, lập trình, kỹ thuật máy tính và kiến thức chuyên ngành. Điều này đòi hỏi sinh viên phải có kiến thức rộng và kỹ năng thực hành. Tuy nhiên, với sự quan tâm và nỗ lực, bất kỳ ai cũng có thể học và thành công trong ngành này.
Phó giáo sư Phạm Quý Mười chỉ ra sự khác biệt giữa Khoa học Dữ liệu, Phân tích Dữ liệu và Khoa học Máy tính như sau:
1. Khoa học Dữ liệu (Data Science): Tập trung vào việc thu thập, xử lý, phân tích dữ liệu và xây dựng các mô hình dự đoán để đưa ra các quyết định thông minh trong một loạt các lĩnh vực. Nó bao gồm cả việc sử dụng các phương pháp thống kê, máy học và trí tuệ nhân tạo để hiểu và tạo ra giá trị từ dữ liệu.
2. Phân tích Dữ liệu (Data Analysis): Tập trung vào việc phân tích dữ liệu để tìm hiểu và diễn giải thông tin từ dữ liệu đã thu thập. Phân tích dữ liệu thường tập trung vào việc sử dụng các phương pháp thống kê để tóm tắt và diễn giải dữ liệu một cách chi tiết.
3. Khoa học Máy tính (Computer Science): Tập trung vào việc nghiên cứu và phát triển các công nghệ và ứng dụng trong lĩnh vực máy tính. Khoa học Máy tính bao gồm cả lý thuyết và thực hành về các lĩnh vực như lập trình, cơ sở dữ liệu, hệ thống thông tin, và trí tuệ nhân tạo.