1.โครงสร้างของแฟ้มข้อมูล
ในระบบคอมพิวเตอร์ หน่วยที่เล็กที่สุดของข้อมูล คือ Bit (Binary Digit) ซึ่งใช้ แทนเหตุการณ์ หรือ สถานะได้เพียง 2 อย่างเท่านั้นไม่เพียงพอ
กับการแทนข้อมูลจำนวนมหาศาลได้ จึงรวมกลุ่มของบิตเข้าด้วยกันเพื่อแทนอักขระ 1 ตัว แต่หน่วยของข้อมูลที่เล็กที่สุดที่มีความหมายต่อผู้ใช้คือ เขตข้อมูล (Field)
ซึ่งประกอบด้วยอักขระตั้งแต่ 1 ตัว ขึ้นไปมารวมกันให้เกิดความหมายขึ้นมาใช้ แทนข้อมูลเขตข้อมูลที่รวมกันอย่างมีจุดประสงค์กลายเป็นระเบียนข้อมูลที่สามารถนำ
ไปใช้งานได้
การจัดโครงสร้างข้อมูล
4.การจัดระบบแฟ้ม File System
4.1 การจัดเก็บแฟ้มเรียงต่อเนื่องกันตลอดทั้งแฟ้ม ( Continuous Allocation)
เป็นแนวคิดพื้นฐานในการจัดเก็บแฟ้มข้อมูล โดยจะจัดเก็บแฟ้มข้อมูลในรูปของลำดับบล็อกที่ต่อเนื่องกัน เช่นหากแต่ละบล็อกมีขนาด 1 กิโลไบต์ แฟ้มข้อมูลขนาด 50 กิโลไบต์ ก็ต้องใช้เนื้อที่ขนาด 50 กิโลไบต์ที่ต่อเนื่องกันในดิสก์ ซึ่งแนวคิดในการจัดเก็บข้อมูลแบบนี้จะมีข้อดี 2 ประการคือ มีโครงสร้างไม่ซับซ้อนและใช้งานง่าย เนื่องจากในระบบแฟ้มข้อมูลแบบนี้ไม่จำเป็นต้องมีการรักษาค่าต่างๆ ของดิสก์เลย เพียงแต่ทราบตำแหน่งเริ่มต้นของแฟ้มข้อมูลก็จะสามารถทำงานได้โดยการอ่านข้อมูลต่อเนื่องกันไปเรื่อยๆ จนกว่าจะสิ้นสุดแฟ้มข้อมูล และข้อดีประการที่สองคือในการอ่านข้อมูลทั้งแฟ้มนั้นสามารถทำได้โดยใช้คำสั่งอ่านข้อมูลเพียงคำสั่งเดียวก็จะสามารถอ่านข้อมูลที่มีในแฟ้มข้อมูลนั้นได้ทั้งหมด และในทางกลับกันแฟ้มข้อมูลลักษณะนี้ก็มีข้อเสียสองประการเช่นเดียวกันคือ ประการแรกระบบปฏิบัติการจะไม่สามารถทราบขนาดของแฟ้มข้อมูลเมื่อเริ่มมีการสร้างขึ้นมาได้
ในการเขียนโปรแกรมคอมพิวเตอร์ เพื่อประยุกต์ใช้งานในองค์การ ผู้เขียนโปรแกรมจะต้องมีความเข้าใจในระบบจัดการข้อมูล และสามารถ
จัดรูปแบบข้อมูล เพื่อที่จะสามารถเข้าถึง (Access) และเรียกใช้ได้อย่างมีประสิทธิภาพ กระบวนการในการจัดการกับข้อมูลมีดังนี้
1. ข้อมูลจะต้องเป็นตัวแทน (Represent) ของสิ่งที่องค์กรต้องการศึกษาและจัดต้องถูกจัดเก็บ (Store) ในรูปแบบที่สามารถเข้าถึงได้ในภายหลัง
2.ข้อมูลต้องถูกจัดระบบ (Organize) ให้สามารถเลือกเข้าถึงได้ตามจุดมุ่งหมายของผู้ใช้ ในลักษณะต่าง ๆ กัน และเข้าถึงได้อย่างมีประสิทธิภาพ
2.ข้อมูลต้องถูกจัดระบบ (Organize) ให้สามารถเลือกเข้าถึงได้ตามจุดมุ่งหมายของผู้ใช้ ในลักษณะต่าง ๆ กัน และเข้าถึงได้อย่างมีประสิทธิภาพ
3. ข้อมูลจะต้องถูกประมวลผล (Process) และนำเสนอ (Present) ในรูปแบบที่ตรงตามความต้องการของผู้ใช้อย่างมีประสิทธิภาพ
4. ข้อมูลจะต้องถูกจัดในลักษณะที่สามารถป้องกัน (Project) และจัดการ (Manage) ได้อย่างมีประสิทธิภาพ
2.ชนิดของแฟ้มข้อมูล
ในการสร้างชื่อไฟล์ในปัจจุบันจะมีการกำหนดชื่อไฟล์โดยมีส่วนประกอบ 2 ส่วน คือส่วนชื่อ และส่วนนามสกุล โดยส่วนชื่อจะเป็นคำภาษาอังกฤษ หรือภาษาใดๆที่ระบบปฏิบัติการเข้าใจ ในระบบ DOS จะอนุญาตให้ตั้งชื่อได้ไม่เกิน 8 ตัวอักษร แต่ในวินโดว์ได้กำหนดความยาวชื่อได้มากกว่า ส่วนนามสกุล จะเป็นส่วนบอกชนิดของไฟล์นั้นๆ โดยทั่วไปจะมีความยาวอยู่ระหว่าง 0 ถึง 3 ตัวอักษร แต่อาจมีบางชนิดที่ยาว 4 หรือ 5 ตัวอักษร ในการตั้งชื่อไฟล์ เราจะเขียนส่วนของชื่อ และนามสกุลต่อกัน โดยมีเครื่องหมายจุด(.) เป็นตัวคั่น
ชนิดแฟ้มข้อมูล
|
ลักษณะนามสกุล
|
หน้าที่
|
Executable
|
Exe, Com, Bin
|
ประมวลผลคำสั่งภาษาเครื่อง
|
Object
|
Obj, O
|
ทำหน้าที่คอมไพล์, หรือเป็นภาษาเครื่อง
|
Source Code
|
C, P, Pas, 177, Asm, A
|
เป็น Source Code ของภาษาคอมพิวเตอร์
|
Batch
|
Bat, Sh
|
เป็นชุดคำสั่ง
|
Text
|
Txt, Doc
|
ข้อมูลที่เป็นข้อความ
|
Word Processor
|
Wp, Tex, Rrf
|
รูปแบบของการประมวลผลข้อความ
|
Library
|
Lib, A
|
ข้อมูลเกี่ยวกับ Library หรือ Routine
|
Print or View
|
Ps, Dvi, Gif, Jpg
|
ไฟล์ที่เก็บข้อมูลเป็นรหัส ASCII หรือฐาน 2
|
Archive
|
Arc, Zip, Rar
|
เป็นไฟล์ หรือกลุ่มไฟล์ที่ได้ผ่านการบีบอัดข้อมูลไว้
|
3.วิธีการเข้าถึงแฟ้มข้อมูล
3.1 การเข้าถึงข้อมูลแบบเรียงลำดับ(Sequential Access)
ในการเข้าถึงข้อมูลแบบเรียงลำดับเป็นวิธีการแก้ไขที่ธรรมดาที่สุด เช่นตัวแกไข(Editor) และคอมไพล์เลอร์(Compiler) จะมีวิธีการเข้าถึงข้อมูลแบบนี้
การทำงานบนแฟ้มแบบนี้ คือ การอ่านและการเขียน การอ่านจะอ่านส่วนถัดไปของแฟ้ม และเปลี่ยนค่าตัวชี้แฟ้มข้อมูลโดยอัตโนมัติตามตำแหน่งของ I/O เหมือนกับการเขียนแบบต่อท้ายข้อมูล แต่ละแฟ้มข้อมูลสามารถกลับไปเริ่มต้นใหม่ และบางระบบโปรแกรมอาจจะสามารถข้ามไปข้างหน้า หรือข้างหลัง
สำหรับการเข้าถึงข้อมูลแบบเรียงลำดับเป็นพื้นฐานการทำงานของเทปแม่เหล็ก
3.2 การเข้าถึงข้อมูลแบบสุ่ม(Random Access)
เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่เข้าถึงได้โดยตรง เมื่อต้องการอ่านค่าเรคคอร์ดใดๆสามารถทำการเลือกหรืออ่านค่านั้นได้ทันที ไม่จำเป็นต้องผ่านเรคคอร์ดแรกๆเหมือนกับแฟ้มข้อมูลแบบเรียงลำดับ ซึ่งทำให้การเข้าถึงข้อมูลได้รวดเร็วกว่า ปกติจะมีการจัดเก็บในสื่อที่มีลักษณะการเข้าถึงได้โดยตรงประเภทจานแม่เหล็ก เช่น ดิสเก็ตต์, ฮาร์ดดิสก์หรือ CD-ROM เป็นต้น
4.การจัดระบบแฟ้ม File System
4.1 การจัดเก็บแฟ้มเรียงต่อเนื่องกันตลอดทั้งแฟ้ม ( Continuous Allocation)
เป็นแนวคิดพื้นฐานในการจัดเก็บแฟ้มข้อมูล โดยจะจัดเก็บแฟ้มข้อมูลในรูปของลำดับบล็อกที่ต่อเนื่องกัน เช่นหากแต่ละบล็อกมีขนาด 1 กิโลไบต์ แฟ้มข้อมูลขนาด 50 กิโลไบต์ ก็ต้องใช้เนื้อที่ขนาด 50 กิโลไบต์ที่ต่อเนื่องกันในดิสก์ ซึ่งแนวคิดในการจัดเก็บข้อมูลแบบนี้จะมีข้อดี 2 ประการคือ มีโครงสร้างไม่ซับซ้อนและใช้งานง่าย เนื่องจากในระบบแฟ้มข้อมูลแบบนี้ไม่จำเป็นต้องมีการรักษาค่าต่างๆ ของดิสก์เลย เพียงแต่ทราบตำแหน่งเริ่มต้นของแฟ้มข้อมูลก็จะสามารถทำงานได้โดยการอ่านข้อมูลต่อเนื่องกันไปเรื่อยๆ จนกว่าจะสิ้นสุดแฟ้มข้อมูล และข้อดีประการที่สองคือในการอ่านข้อมูลทั้งแฟ้มนั้นสามารถทำได้โดยใช้คำสั่งอ่านข้อมูลเพียงคำสั่งเดียวก็จะสามารถอ่านข้อมูลที่มีในแฟ้มข้อมูลนั้นได้ทั้งหมด และในทางกลับกันแฟ้มข้อมูลลักษณะนี้ก็มีข้อเสียสองประการเช่นเดียวกันคือ ประการแรกระบบปฏิบัติการจะไม่สามารถทราบขนาดของแฟ้มข้อมูลเมื่อเริ่มมีการสร้างขึ้นมาได้
4.2 การจัดเก็บแฟ้มแบบตารางแฟต (File Allocation Table : FAT )
ในการจัดเก็บแฟ้มแบบแฟต ระบบปฏิบัติการต้องมีวิธีที่จะทราบว่าแต่ละบล็อคของแฟ้มจะเก็บไว้ในบล็อคใดในดิสก์ และไม่จำเป็นที่ข้อมูลของแฟ้มเดียวกันจะอยู่ใน บล็อคที่ติดกัน ซึ่งจะต้องมีลิงก์เชื่อมระหว่างบล็อคที่เก็บข้อมูลของแฟ้มแฟ้มเดียวกัน ดังนั้นใน บล็อคขนาด 512 ไบต์ จะใช้ประโยชน์ในการเก็บข้อมูลของแฟ้มเพียง 510 ไบต์ ส่วนอีก 2 ไบต์ที่เหลือจะใช้ในการเก็บหมายเลขบล็อคลำดับถัดไปที่เก็บข้อมูลแฟ้มเดียวกัน ซึ่งในกรณีที่แฟ้มมีขนาดใหญ่จะทำให้ต้องใช้เวลามากในการเข้าถึงแฟ้ม เนื่องจากต้องย้ายไปยังบล็อคต่างๆ ที่เก็บข้อมูลของแฟ้มหลายบล็อค
ภาพแสดงแฟ้มข้อมูลแบบตารางแฟต
4.3 การจัดระบบแฟ้มแบบเรด RAID
แต่อย่างไรก็ตามจากการที่ปัจจุบันดิสก์เองก็มีความเร็วในการทำงาน และความจุมากอยู่แล้วการพยายามปรับปรุงการทำงานให้ดีขึ้นกว่าเดิมอีกโดยอาศัยแนวความคิดในลักษณะดังกล่าวก็ยากลำบากขึ้น
เมื่อเกิดปัญหาความยากลำบากในการปรับปรุงการทำงาน ผู้ออกแบบฮาร์ดแวร์จึงหันไปอาศัยแนวคิดการทำงานแบบขนานเป็นแนวคิดพื้นฐานในการปรับปรุงการ ทำงานของดิสก์ และได้ออกแบบโครงสร้างการทำงานของดิสก์ในรูปแบบใหม่ซึ่งเรียกว่าเรด ( RAID : Redundant Array of Inexpensive Disks ) ซึ่งในการใช้งานเรดนี้มีแนวคิดในการประยุกต์ใช้งานในหลายรูปแบบ โดยมีแนวคิดหลักของการทำงานใน 2 ลักษณะ
คือ การใช้งานเรดในลักษณะของเงากระจก ( Mirroring ) และการใช้งานเรดในลักษณะการแบ่งส่วนของแฟ้ม( Striping ) โดยในการติดตั้งเรดเพื่อใช้งานนั้นจะเป็นลักษณะใดขึ้นอยู่กับซอฟต์แวร์ที่ใช้ในการควบคุมการทำงาน ดังนั้นถึงแม้ว่าในระบบจะมีการติดตั้งเรดเพียงชุดเดียวแต่จะสามารถใช้งานได้ทั้งแบบเงากระจกและแบบแบ่งส่วนของแฟ้มข้อมูล ทั้งนี้ขึ้นกับซอฟต์แวร์ที่ควบคุมการทำงานนั้นเอง โดยแนวคิดของการทำงานของแต่ละลักษณะเป็นดังนี้
ภาพแสดงแฟ้มข้อมูลแบบตารางแฟต
4.3 การจัดระบบแฟ้มแบบเรด RAID
แต่อย่างไรก็ตามจากการที่ปัจจุบันดิสก์เองก็มีความเร็วในการทำงาน และความจุมากอยู่แล้วการพยายามปรับปรุงการทำงานให้ดีขึ้นกว่าเดิมอีกโดยอาศัยแนวความคิดในลักษณะดังกล่าวก็ยากลำบากขึ้น
เมื่อเกิดปัญหาความยากลำบากในการปรับปรุงการทำงาน ผู้ออกแบบฮาร์ดแวร์จึงหันไปอาศัยแนวคิดการทำงานแบบขนานเป็นแนวคิดพื้นฐานในการปรับปรุงการ ทำงานของดิสก์ และได้ออกแบบโครงสร้างการทำงานของดิสก์ในรูปแบบใหม่ซึ่งเรียกว่าเรด ( RAID : Redundant Array of Inexpensive Disks ) ซึ่งในการใช้งานเรดนี้มีแนวคิดในการประยุกต์ใช้งานในหลายรูปแบบ โดยมีแนวคิดหลักของการทำงานใน 2 ลักษณะ
คือ การใช้งานเรดในลักษณะของเงากระจก ( Mirroring ) และการใช้งานเรดในลักษณะการแบ่งส่วนของแฟ้ม( Striping ) โดยในการติดตั้งเรดเพื่อใช้งานนั้นจะเป็นลักษณะใดขึ้นอยู่กับซอฟต์แวร์ที่ใช้ในการควบคุมการทำงาน ดังนั้นถึงแม้ว่าในระบบจะมีการติดตั้งเรดเพียงชุดเดียวแต่จะสามารถใช้งานได้ทั้งแบบเงากระจกและแบบแบ่งส่วนของแฟ้มข้อมูล ทั้งนี้ขึ้นกับซอฟต์แวร์ที่ควบคุมการทำงานนั้นเอง โดยแนวคิดของการทำงานของแต่ละลักษณะเป็นดังนี้