เทคโนโลยีสารสนเทศโครงสร้างพื้นฐาน
ปัญหาของการจัดการข้อมูลในอดีต
ข้อมูลที่จัดเก็บเป็นเอกสารหรือการจัดเก็บด้วยระบบฐานข้อมูลที่ใช้
ภาษาคอมพิวเตอร์ในการเขียนชุดคำสั่ง เริ่มมีการเขียนด้วยภาษาในยุคที่ 3 เช่น
ภาษาฟอร์เทรน ภาษาโคบอล ภาษาซี เป็นต้น
กระบวนการเขียนโปรแกรมชุดคำสั่งจะต้องเขียนโดยการใช้โครงสร้างข้อมูล การสร้างแฟ้ม แทรกข้อมูล
แก้ไขหรือปรับปรุงข้อมูล อาจเกิดปัญหาหลาย ๆ อย่าง ปัญหาเหล่านั้นได้แก่
ความยุ่งยากจากการประมวลผลกับระบบแฟ้มข้อมูล แฟ้มข้อมูลไม่มีความอิสระ
แฟ้มข้อมูลมีความซ้ำซ้อนกันมาก แฟ้มข้อมูลมีความถูกต้องของข้อมูลน้อย แฟ้มข้อมูลมีความปลอดภัยน้อย
และไม่มีการควบคุมจากศูนย์กลาง เป็นต้น รายละเอียด มีดังนี้
1. ความยุ่งยากจากการประมวลผลกับระบบแฟ้มข้อมูล
การดำเนินงานกับแฟ้มข้อมูลในระบบคอมพิวเตอร์นั้นจำเป็นจะต้องเขียนคำสั่งต่างๆ
ในโปรแกรมเพื่อสร้างแฟ้มข้อมูล ใช้แฟ้มข้อมูล
และปรับปรุงแฟ้มข้อมูลให้เป็นปัจจุบัน
รูปแบบของคำสั่งเหล่านี้ถูกกำหนดไว้ในภาษาคอมพิวเตอร์ต่างๆ แล้ว
2.แฟ้มข้อมูลไม่มีความเป็นอิสระ
2.แฟ้มข้อมูลไม่มีความเป็นอิสระ
ในระบบแฟ้มข้อมูลถ้ามีการแก้ไขโครงสร้างข้อมูลใหม่
ย่อมส่งผลกระทบถึงคำสั่งที่ได้เขียนเอาไว้ก่อนหน้านี้ด้วย
เนื่องจากการเรียกใช้ข้อมูลที่เก็บอยู่ในระบบแฟ้มข้อมูล ต้องใช้โปรแกรมที่เขียนขึ้นมาเพื่อเรียกข้อมูลในแฟ้มข้อมูลโดยตรง
3. แฟ้มข้อมูลมีความซ้ำซ้อนมาก
3. แฟ้มข้อมูลมีความซ้ำซ้อนมาก
เนื่องจากการใช้งานระบบฐานข้อมูลนั้นต้องมีการออกแบบฐานข้อมูลเพื่อให้มีความซ้ำซ้อนของข้อมูลน้อยที่สุด
จุดประสงค์หลักของการออกแบบฐานข้อมูลเพื่อการลดความซ้ำซ้อนนั่นเองสาเหตุที่ต้องลดความซ้ำซ้อน
เนื่องจากความยากในการปรับปรุงข้อมูล กล่าวคือถ้าเก็บข้อมูลซ้ำซ้อนกันหลายแห่ง
4. แฟ้มข้อมูลมีความถูกต้องของข้อมูลน้อย
4. แฟ้มข้อมูลมีความถูกต้องของข้อมูลน้อย
เนื่องจากแฟ้มข้อมูลไม่สามารถตรวจสอบกฎบังคับความถูกต้องของข้อมูลให้ได้
ถ้าต้องการควบคุมข้อมูลโปรแกรมเมอร์ต้องเขียนโปรแกรมเพื่อควบคุมกฎระเบียบต่างๆ
เองทั้งหมด
5.แฟ้มข้อมูลมีความปลอดภัยน้อย
5.แฟ้มข้อมูลมีความปลอดภัยน้อย
ในระบบฐานข้อมูล
ถ้าหากทุกคนสามารถเรียกดูและเปลี่ยนแปลงข้อมูลในฐานข้อมูลทั้งหมดได้
อาจก่อให้เกิดความเสียหายต่อข้อมูลได้
และข้อมูลบางส่วนอาจเป็นข้อมูลที่ไม่อาจเปิดเผยได้หรือเป็นข้อมูลเฉพาะของผู้บริหาร
หากไม่มีการจัดการด้านความปลอดภัยของข้อมูล ฐานข้อมูลจะไม่สามารถใช้เก็บข้อมูลบางส่วนได้
ระบบฐานข้อมูลส่วนใหญ่มีการรักษาความปลอดภัยของข้อมูล
ข้อมูลของคอมพิวเตอร์
ข้อมูลของคอมพิวเตอร์
เครื่องคอมพิวเตอร์เป็นอุปกรณ์อิเล็กทรอนิกส์
ที่ใช้สัญญาณดิจิตอลในการทำงานต่าง ๆ เช่น เก็บข้อมูล ประมวลผล และแสดงผลลัพธ์
ดังนั้นการมองข้อมูลของเครื่องคอมพิวเตอร์จึงไม่เหมือนผู้ใช้งาน
1. บิท (Bit)
มายถึง ค่าที่เล็กที่สุด ที่คอมพิวเตอร์รู้จัก เนื่องจากเครื่องคอมพิวเตอร์ทำงานด้วยระบบไฟฟ้า
และสัญญาณของกระแสไฟฟ้ามี 2 สภาวะ คือ
สภาวะที่วงจรมีกระแสไฟฟ้าไหลผ่านกับวงจรที่ไม่มีกระแสไฟฟ้าไหลผ่าน
2. ไบท์ (Byte)
คือ การนำบิทมารวมกันเพื่อใช้แทนข้อมูลที่เป็นตัวเลข
ตัวอักษรและสัญลักษณ์ ต่าง ๆ ในปัจจุบัน 1 ไบท์ ประกอบด้วยบิท 8 บิท
ซึ่งสามารถสื่อความหมายได้256 แบบ
ลักษณะการนำบิทมารวมกันเพื่อใช้แทนข้อมูลของมนุษย์นั้น
มีระบบมาตรฐานในการกำหนดรหัสแทนข้อมูล 2 ระบบ
การมองข้อมูลของผู้ใช้งาน
เครื่องคอมพิวเตอร์มองข้อมูลในลักษณะบิทและไบท์
ดังที่กล่าวมาแล้ว ในขณะที่ผู้ใช้งานมองข้อมูลในลักษณะโครงสร้างข้อมูลดังนี้
1. ตัวอักขระ (Character)
หมายถึง สัญลักษณ์ต่าง ๆ ที่มนุษย์ใช้งาน ตัวอักขระ
1 ตัว
เมื่อนำไปเก็บในคอมพิวเตอร์จะเรียกว่า 1 ไบท์ แบ่งออกเป็น 3 ประเภท คือ
1.1 ตัวเลข (Nuneric)
คือ เลขฐาน 10 ซึ่งมีลักษณ์ใช้ 10 ตัว คือ 0, 1,
2, 3, 4,5, 6, 7, 8, 9
1.2 ตัวอักษร (Alphabetic)
คือ ตัวอักษร A ถึง Z ตัวอักษร
a ถึง z
1.3 สัญลักษณ์พิเศษ (Special
Symbol) คือ สัญลักษณ์ต่าง ๆ เช่น เครื่องหมาย
2. เขตข้อมูล (Field)
หรือ รายการ(Item) คือ
การนำตัวอักขระมาประกอบกันแล้วมีความหมายอย่างใดอย่างหนึ่ง
3. ระเบียน (Record)
คือ กลุ่มของฟิลด์ที่มีความสัมพันธ์กันมารวมกัน
เช่นเรคคอร์ดของสินค้าประกอบด้วยเขตข้อมูลของสินค้า
4. แฟ้มข้อมูล (File)
คือ การนำเรคคอร์ดชนิดเดียวกันมารวมไว้ด้วยกัน เช่นแฟ้มข้อมูลสินค้า
(ดูตัวอย่าง ระเบียนสินค้าข้างบน)
4.1 แฟ้มข้อมูลหลัก (Master
File) คือ แฟ้มข้อมูลที่เก็บข้อมูลถาวร(Permanent data) ที่มีความทันสมัยและตรงกับความเป็นจริง
4.2 แฟ้มรายการ (Transaction
File) คือ
แฟ้มข้อมูลที่รวบรวมการเปลี่ยนแปลงบางอย่างของแฟ้มข้อมูลหลัก เก็บเป็นรายการย่อย ๆ
โครงสร้างการจัดเก็บแฟ้มข้อมูล (File
Organization)
อุปกรณ์ที่ใช้ในการจัดเก็บข้อมูลมีหลายชนิด
ดังนั้นจึงต้องมีการจัดการข้อมูลให้อยู่ในโครงสร้างที่เหมาะสมกับอุปกรณ์ที่ใช้และง่ายต่อการเข้าถึงข้อมูล
ซึ่งประกอบไปด้วยการจัดเก็บข้อมูล (Store)
1) โครงสร้างแฟ้มข้อมูลแบบเรียงลำดับ (Sequential
file Organization)เน้นโครงสร้างแฟ้มข้อมูลที่ง่ายและมีประสิทธิภาพสูงใช้กับงานประมวลผลที่มีข้อมูลขนาดใหญ่และมีการกำหนดช่วงเวลาประมวลผล
2) โครงสร้างแฟ้มข้อมูลแบบสุ่ม (Random
File Organization) เป็นโครงสร้างแฟ้มข้อมูลที่ใช้อุปกรณ์ในการเข้าถึงข้อมูลได้โดยตรง
(Direct Access Storage Device)เช่น ดิสก์ ซีดี
การจัดเก็บวิธีนี้จะมีแฟ้มข้อมูล 2 ชุด คือ แฟ้มข้อมูลหลัก
ซึ่งระเบียนข้อมูลที่จัดเก็บไม่เรียงลำดับกับแฟ้มดัชนี (Indexts)
5. ฐานข้อมูล (Database)
ถูกพัฒนาขึ้นมาเพื่อขจัดปัญหาที่เกิดขึ้นในการใช้แฟ้มข้อมูล
ซึ่งผู้ใช้พบว่าโปรแกรมทุกโปรแกรมที่เขียนขึ้นจะต้องมีการสร้างแฟ้มข้อมูลขึ้นเฉพาะการใช้งานของโปรแกรมนั้น
ๆ
5.1 ฐานข้อมูลแบบลำดับขั้น
มีโครงสร้างคล้ายต้นไม้กลับหัว ข้อมูลจะมีความสัมพันธ์แบบพ่อกับลูก (Parent
to Child) โดยมี Pointer ชี้และเชื่อมความสัมพันธ์ระหว่างข้อมูล
ซึ่งอาจเป็นความสัมพันธ์ชนิดหนึ่งต่อกลุ่ม (One-to-Many)
5.2 ฐานข้อมูลแบบเครือข่าย
เป็นโครงสร้างที่ออกแบบมาเพื่อขจัดปัญหาที่เกิดขึ้นในโครงสร้างแบบลำดับขั้น
5.3 ฐานข้อมูลเชิงสัมพันธ์
เป็นการออกแบบโครงสร้างของข้อมูลให้อยู่ในรูปตาราง (Table)
2 มิติ
ปัญหาในการใช้ข้อมูล
ปัญหาในการใช้ข้อมูล
ปัญหาในการใช้ข้อมูล
ปัญหาในการใช้ข้อมูลทุติยภูมิ
การใช้ข้อมูลทุติยภูมิมักจะมีปัญหาเกี่ยวกับเรื่องต่าง ๆ ดังต่อไปนี้
1)ความถูกต้องเชื่อถือได้ของข้อมูล
2) ความทันสมัยของข้อมูล
3) การขาดหายไปของข้อมูลบางรายการ
นอร์มัลไลเซชัน (Normalization)
ความซ้ำซ้อนของข้อมูลทำให้ข้อมูลมีขนาดใหญ่เกินความจำเป็น
ส่วนที่ซ้ำซ้อนเป็นปัญหาของตารางข้อมูล (รีเลชั่น)
แต่สามารถขจัดได้ด้วยขบวนการนอร์มัลไลเซชัน โดยการนอร์มัลไลเซชันถูกคิดค้นโดย E.F.Codd
ซึ่งเป็นกระบวนการที่นำเค้าร่างของ relation มาทำให้อยู่ในรูปแบบที่เป็นบรรทัดฐาน
(Normal Form) เพื่อให้แน่ใจว่าการออกแบบเค้าร่างของ relation
เป็นการออกแบบที่เหมาะสม
นอร์มัลไลเซชัน คือ
กระบวนที่ดำเนินการอย่างเป็นลำดับเพื่อลดปัญหาการซ้ำซ้อนของข้อมูล
จึงกล่าวได้ว่านอร์มัลไลเซชันเป็นการออกแบบเพื่อลดความซ้ำซ้อนในข้อมูล
การนอร์มอลไลท์เซชันคือการแปลงข้อมูลที่มีโครงสร้างแบบตาราง
(รีเลชันนัล) จากรูปแบบที่มีความซ้ำซ้อนให้อยู่ในรูปที่ใช้งานได้ง่าย
เพื่อให้ทำการเพิ่มข้อมูล ลบข้อมูล
หรือแก้ไขข้อมูลที่อยู่ในรีเลชันได้โดยไม่เกิดความผิดพลาด
หมายเหตุ การขึ้นต่อกันแบบทรานซิทีฟ (Transitive
Dependency) หมายถึง
แอตทริบิวต์ที่ไม่ใช่คีย์หลักสามารถระบุค่าแอตทริบิวต์อื่น
กระบวนการนอร์มัลไลเซชัน
( Normalization
Process ) เป็นกระบวนการเค้าร่างของรีเลชันมาทำให้อยู่ในรูปแบบที่เป็นบรรทัดฐาน
( Normal Form ) เพื่อให้แน่ใจว่าการออกแบบเค้าร่างของรีเลชันเป็นการออกแบบที่เหมาะสม
กระบวนการนอร์มัลไลเซชันมีหลายระดับ (แต่ปฏิบัติการทำนอร์มอลไลซ์จะเริ่มจาก E-R
Model ก่อน)
ประโยชน์นอร์มัลไลเซชัน คือ
1. ลดที่ว่างที่ต้องใช้ในการเก็บข้อมูล
2. ลดความผิดพลาดและความไม่ตรงกันของข้อมูลในฐานข้อมูล
3. ลดการสูญเสียเวลาการเข้าถึงข้อมูลที่เกิดซ้ำซ้อนในข้อมูลของการลบและแก้ไขข้อมูล
4. เพิ่มความคงทนแก่โครงสร้างฐานข้อมูล
แผนผังความสัมพันธ์ นอร์มัลไลเซชัน
นอร์มัลไลเซชัน เป็นกระบวนการเพื่อพัฒนาการ เชื่อมต่อของข้อมูลเพื่อแก้ปัญหาของตารางข้อ(รีเลชั่น)
ที่ว่าการออกแบบฐานข้อมูลทั้งทางตรรกะ และทางกายภาพที่ได้ออกมาใช้ได้หรือยัง
การนอร์มัลไลเซชันแบ่งออกได้เป็นหลายระดับ
ได้แก่
นอร์มัลฟอร์ม - ระดับที่1
- (First Normal Form (1NF)), ทุกแอททริบิวต์ในแต่ละแถวมีค่าของข้อมูลเพียงค่าเดียว
ตารางหรือรีเลชันที่ไม่มีกลุ่มข้อมูลใดๆซ้ำอยู่ในรีเลชัน
คือ ทุกช่องในรีเลชันจะต้องมีข้อมูลเพียงค่าเดียวเท่านั้น สรุป " รีเลชันใดจะอยู่รูป 1NF
ได้ รีเลชันั้นจะต้องไม่มีข้อมูลซ้ำอยู่ "
ดังนั้นจะต้องกำจัดกลุ่มข้อมูลซ้ำออกไปแล้วทำการหาคีย์หลักของรีเลชัน
อาจจะต้องมีการแตกรีเลชันเป็นหลายรีเลชันก็ได้
Database
Database หรือ ฐานข้อมูล คือ กลุ่มของข้อมูลที่ถูกเก็บรวบรวมไว้ โดยมีความสัมพันธ์ซึ่งกันและกัน โดยไม่ได้บังคับว่าข้อมูลทั้งหมดนี้จะต้องเก็บไว้ในแฟ้มข้อมูลเดียวกันหรือแยกเก็บหลาย ๆ แฟ้มข้อมูล
Database หรือ ฐานข้อมูล คือ กลุ่มของข้อมูลที่ถูกเก็บรวบรวมไว้ โดยมีความสัมพันธ์ซึ่งกันและกัน โดยไม่ได้บังคับว่าข้อมูลทั้งหมดนี้จะต้องเก็บไว้ในแฟ้มข้อมูลเดียวกันหรือแยกเก็บหลาย ๆ แฟ้มข้อมูล
ระบบฐานข้อมูล (Database
System) คือ ระบบที่รวบรวมข้อมูลต่าง ๆ
ที่เกี่ยวข้องกันเข้าไว้ด้วยกันอย่างมีระบบมีความสัมพันธ์ระหว่างข้อมูลต่าง ๆ
ที่ชัดเจน ในระบบฐานข้อมูลจะประกอบด้วยแฟ้มข้อมูลหลายแฟ้มที่มีข้อมูล
เกี่ยวข้องสัมพันธ์กันเข้าไว้ด้วยกันอย่างเป็นระบบและเปิดโอกาสให้ผู้ใช้สามารถใช้งานและดูแลรักษาป้องกันข้อมูลเหล่านี้
ได้อย่างมีประสิทธิภาพ โดยมีซอฟต์แวร์ที่เปรียบเสมือนสื่อกลางระหว่าง
ผู้ใช้และโปรแกรมต่าง ๆ
ที่เกี่ยวข้องกับการใช้ฐานข้อมูล เรียกว่า ระบบจัดการฐานข้อมูล หรือ DBMS
(data base management system)มีหน้าที่ช่วยให้ผู้ใช้เข้าถึงข้อมูลได้ง่ายสะดวกและมีประสิทธิภาพ
การเข้าถึงข้อมูลของผู้ใช้อาจเป็นการสร้างฐานข้อมูล การแก้ไขฐานข้อมูล
หรือการตั้งคำถามเพื่อให้ได้ข้อมูลมา
โดยผู้ใช้ไม่จำเป็นต้องรับรู้เกี่ยวกับรายละเอียดภายในโครงสร้างของฐานข้อมูล
ประโยชน์ของฐานข้อมูล
1 ลดการเก็บข้อมูลที่ซ้ำซ้อน
ข้อมูลบางชุดที่อยู่ในรูปของแฟ้มข้อมูลอาจมีปรากฏอยู่หลาย ๆ แห่ง
เพราะมีผู้ใช้ข้อมูลชุดนี้หลายคน เมื่อใช้ระบบฐานข้อมูลแล้วจะช่วยให้ความซ้ำซ้อนของข้อมูลลดน้อยลง
2 รักษาความถูกต้องของข้อมูล
เนื่องจากฐานข้อมูลมีเพียงฐานข้อมูลเดียว ในกรณีที่มีข้อมูลชุดเดียวกันปรากฏอยู่หลายแห่งในฐานข้อมูล
ข้อมูลเหล่านี้จะต้องตรงกัน ถ้ามีการแก้ไขข้อมูลนี้ทุก ๆ
แห่งที่ข้อมูลปรากฏอยู่จะแก้ไขให้ถูกต้องตามกันหมดโดยอัตโนมัติด้วยระบบจัดการฐานข้อมูล
2.3
การป้องกันและรักษาความปลอดภัยให้กับข้อมูลทำได้อย่างสะดวก การป้องกันและรักษาความปลอดภัยกับข้อมูลระบบฐานข้อมูลจะให้เฉพาะผู้ที่เกี่ยวข้องเท่านั้น
ซึ่งก่อให้เกิดความปลอดภัย(security) ของข้อมูลด้วย
ไม่มีความคิดเห็น:
แสดงความคิดเห็น