[Database] – Khái niệm cơ sở dữ liệu là gì, các hợp phần của CSDL
Ghi chú: Tài liệu trích dẫn
Với những ai học tập, làm việc trong lĩnh vực công nghệ thông tin chắc chắn sẽ không còn xa lạ với thuật ngữ cơ sở dữ liệu. Tuy nhiên không phải ai cũng có thể giải thích được đầy đủ khái niệm cơ sở dữ liệu là gì, các thành phần cơ bản của chúng như thế nào? Tất cả sẽ được chúng tôi giải đáp chi tiết trong nội dung bài viết dưới đây.
Cơ sở dữ liệu là gì? Các thuật ngữ liên quan
Dữ liệu là gì?
Trước khi tìm hiểu khái niệm cơ sở dữ liệu là gì thì bạn cũng cần phải hiểu được khái niệm dữ liệu là gì. Dữ liệu là những thông tin dưới dạng kí hiệu chữ viết, số, hình ảnh, âm thanh hoặc các dạng tương tự.
Cơ sở dữ liệu là gì? Database là gì?
Cơ sở dữ liệu có tên tiếng anh là Database, viết tắt là CSDL. Là một tập hợp các dữ liệu có tổ chức, được lưu trữ và truy cập điện tử từ hệ thống máy tính. Khi cơ sở dữ liệu phức tạp hơn, chúng sẽ được phát triển bằng cách sử dụng các thiết kế và mô hình hóa hình thức.
Khái niệm CSDL là gì còn được định nghĩa là một tập hợp thông tin có cấu trúc. Tuy nhiên, định nghĩa này chỉ được sử dụng trong lĩnh vực công nghệ thông tin và nó được hiểu rõ dưới dạng là một tập hợp các liên kết dữ liệu để lưu trữ trên thiết bị như đĩa hoặc băng. Dữ liệu này được duy trì dưới dạng tập hợp các thông tin trong hệ điều hành hay lưu trữ hóa trong hệ quản trị cơ sở dữ liệu.
Tóm lại, có sở dữ liệu là hệ thống gồm rất nhiều thông tin, dữ liệu được xây dựng theo một cấu trúc nhất định để đáp ứng nhu cầu khai thác, sử dụng của nhiều người hay chạy nhiều chương trình cùng một lúc. Khi áp dụng hình thức lưu trữ này, sẽ khắc phục được những điểm yếu của việc lưu file thông thường trên máy tính. Các thông tin dữ liệu đảm bảo được sự nhất quán, hạn chế được việc trùng lặp thông tin.
Hệ quản trị cơ sở dữ liệu là gì?
Là chương trình phần mềm, thực hiện việc lưu trữ cơ sở dữ liệu. Hệ quản trị CSDL khi lưu trữ dữ liệu cần phải đảm bảo được tính cấu trúc trong cơ sở dữ liệu và cần phải hỗ trợ việc đọc, chỉnh sửa, thêm và xóa dữ liệu trên CSDL một cách dễ dàng.
Cơ sở dữ liệu quan hệ là gì?
Cơ sở dữ liệu quan hệ có tên tiếng anh là relational database. Là cơ sở dữ liệu số dựa trên mô hình quan hệ dữ liệu. Một hệ thống phần mềm sử dụng để duy trì CSDL là một hệ quản trị cơ sở dữ liệu quan hệ RDBMS. Nhiều hệ thống CSDL quan hệ có tùy chọn sử dụng SQL (ngôn ngữ truy vấn có cấu trúc) tiêu chuẩn để truy vấn và duy trì CSDL.
Cấu trúc dữ liệu là cách lưu trữ, tổ chức dữ liệu có thứ tự, có hệ thống để dữ liệu có thể sử dụng một cách hiệu quả. Để hiểu thêm về khái niệm cấu trúc dữ liệu là gì bạn cần phải biết thêm 2 khái niệm nền tảng hình thành nên cấu trúc dữ liệu đó là:
Interface: Mỗi một cấu trúc dữ liệu sẽ có một interface. Interface sẽ biểu diễn một tập hợp các phép tính mà một cấu trúc dữ liệu hỗ trợ. Một interface sẽ chỉ cung cấp danh sách các phép tính được hỗ trợ, các loại tham số mà chúng có thể chấp nhận và kiểu trả về các phép tính này.
Implementation: Cung cấp sự biểu diễn nội bộ của cấu trúc dữ liệu. Implementation cũng cung cấp các phần định nghĩa của giải thuật được sử dụng trong các phép tính của cấu trúc dữ liệu.
Khái niệm thông tin là gì?
Thông tin là sự phản ánh của sự vật, hiện tượng thế giới khách quan, các hoạt động của con người trong đời sống xã hội; con người sẽ tiếp nhận thông tin để tăng sự hiểu biết cho mình và thực hiện các hoạt động có ích cho cộng đồng.
Các loại kiến trúc của hệ cơ sở dữ liệu
Có 2 loại kiến trúc của hệ CSDL là tập trung và phân tán
Hệ CSDL tập trung
Với hệ CSDL tập trung, toàn bộ các dữ liệu được lưu tại một máy hoặc một dàn máy. Có 3 kiểu CSDL tập trung
Hệ CSDL cá nhân: Là hệ CSDL có 1 người dùng, người này vừa thiết kế, tạo lập, cập nhật và bảo trì CSDL. Đồng thời cũng là người khai thác thông tin, tự lập, hiển thị báo cáo.
Hệ CSDL trung tâm: Là hệ được đặt trên máy tính trung tâm, nhiều người dùng từ xa có thể truy cập thông qua các thiết bị đầu cuối và các phương tiện truyền thông.
Hệ CSDL khách – chủ: Các thành phần của hệ sẽ tương tác với nhau, tạo nên hệ thống gồm các thành phần yêu cầu tài nguyên và thành phần cấp tài nguyên. Ưu điểm của loại cấu trúc này là nâng cao khả năng thực hiện, người dùng dễ dàng bổ sung thêm máy khách,…
Hệ CSDL phân tán
Là một tập hợp các dữ liệu có liên quan, được dùng chung và phân tán về mặt vật lý trên một mạng máy tính. Người dùng truy cập vào CSDL phân tán thông qua các chương trình, ứng dụng. Cấu trúc phân tán dữ liệu thích hợp cho bản chất phân tán có nhiều người dùng.
Có thể chia hệ CSDL phân tán thành 2 loại chính đó là loại thuần nhất và hỗn hợp.
Hệ CSDL phân tán thuần nhất: Các nút trên mạng đều dùng một hệ QTCSDL.
Hệ CSDL phân tán hỗn hợp: Các nút trên mạng sẽ dùng các hệ QTCSDL khác nhau.
Sự cần thiết của các hệ cơ sở dữ liệu
Hệ cơ sở dữ liệu giữ một vai trò vô cùng quan trọng, đó là:
Giảm bớt sự dư thừa dữ liệu trong lưu trữ
Trong các ứng dụng lập trình truyền thống, phương pháp tổ chức dữ liệu vừa tốt kém, lãng phí bộ nhớ, các thiết bị lưu trữ. Nhưng nếu tổ chức dữ liệu theo lý thuyết thì CSDL có thể hợp nhất các tệp dữ liệu lưu trữ của các bài toán, chương trình ứng dụng có thể cùng chia sẻ nguồn tài nguyên trên mạng cùng với hệ CSDL.
Tổ chức lưu trữ dữ liệu theo lý thuyết CSDL có thể triển khai đồng thời trên nhiều ứng dụng cùng CSDL
Các ứng dụng không chỉ được sử dụng để chia sẻ chung tài nguyên dữ liệu mà còn trên cùng một CSDL để có thể triển khai đồng thời nhiều ứng dụng khác nhau trên các thiết bị sau cuối.
Tổ chức dữ liệu theo cơ sở dữ liệu sẽ thống nhất các tiêu chuẩn, thủ tục và các biện pháp an toàn dữ liệu.
Các hệ CSDL sẽ được quản trị bởi một hoặc một nhóm người quản trị CSDL. Người quản trị CSDL có thể áp dụng thống nhất các tiêu chuẩn, thủ tục,….giúp cho công việc bảo trì dữ liệu dễ dàng hơn.
Với các nội dung thông tin trong bài viết “[Database] – Khái niệm cơ sở dữ liệu là gì, các hợp phần của CSDL” hy vọng sẽ giúp ích bạn. Để có thêm nhiều kiến thức hữu ích khác, quý bạn đọc hãy truy cập website Vietlearn.org để tìm hiểu.