ภาพสแตมป์ลาย PCM ในชุด British Post Office Technology ปี 1969
ตอนนี้กระแสของ High Resolution Audio หรือเสียงความละเอียดสูงจัดว่ามาแรงมาก ศัพท์คำนึงที่เรามักจะเห็นประจำก็คือ PCM (Pulse-code modulation) และหน่วยจำนวนนับอย่าง bit หรือ kHz ตามสเปกของฮาร์ดแวร์และไฟล์เพลงต่าง ๆ
วันนี้ RE.V-> เลยจะมาเล่าถึงประวัติและอธิบายรูปแบบสัญญาณเสียงแบบ PCM ให้รู้จักกันมากขึ้นครับ
หมายเหตุ เนื่องจากบทความเวอร์ชันแรกที่โพสไปเมื่อวันที่ 19 ตุลาคม 2014 นั้นยังอ่านแล้วเข้าใจยากอยู่ RE.V-> เลยตัดสินใจเขียนปรับปรุงเพิ่มเติมอีกครั้งในวันที่ 22 กรกฎาคม 2016 ครับ
ที่มา: www.quantium.plus.com/ahr/
PCM ถูกคิดค้นขึ้นในปี 1937 โดย Alec Reeves นักวิทยาศาสตร์ชาวอังกฤษ แต่กว่าเทคโนโลยีจะถูกนำไปใช้งานจริง ก็ปาเข้าไป 28 ปีให้หลัง เมื่อ PCM ถูกนำไปใช้เข้าสัญญาณภาพของยานอวกาศ Mariner IV จากดาวอังคารมายังโลก และก็ใช้เวลาอีกหลายปีถึงจะสามารถดึงเอาความสามารถของเทคโนโลยีออกมาได้อย่างเต็มที่ ซึ่ง Alec ก็ไม่มีโอกาสได้เห็นความสำเร็จนั้น เพราะเขาได้เสียชีวิตไปก่อนในปี 1971
ผังอธิบายการเข้ารหัส PCM ทั้ง 3 ขั้นตอน ที่มา: Wikipedia
สำหรับการแปลงสัญญาณแอนะล็อกเป็นดิจิทัลแบบ PCM จะประกอบไปด้วย 3 ขั้นตอน คือ การสุ่มตัวอย่าง (Sampling) การแบ่งนับ (Quantization) และการเข้ารหัส (Coding) ซึ่งเราจะมาดูกันว่าแต่ละขั้นตอนเป็นอย่างไรบ้าง
Sampling
กราฟสีเขียวคือ continuous signal ส่วนกราฟสีฟ้าคือ discrete signal ที่มา: Wikipedia
การสุ่มตัวอย่าง (Sampling) คือการแปลงสัญญาณที่มีการเปลี่ยนแปลงต่อเนื่องทางเวลา (continuous signal) ให้อยู่ในรูปไม่ต่อเนื่องทางเวลา (discrete signal) ด้วยการสุ่มเก็บตัวอย่าง (sample) ของสัญญาณนั้น ๆ ในช่วงเวลาที่เท่า ๆ กัน ซึ่งช่วงเวลาดังกล่าวก็คือค่าอัตราสุ่มสัญญาณ (sampling rate) นั้นเอง
ภาพแสดงสัญญาณในความถี่ต่าง ๆ ที่ประกอบอยู่ในสัญญาณสีแดง ที่มา: Wikipedia
ในการสุ่มสัญญาณนั้น เราจำเป็นที่จะต้องเลือกอัตราสุ่มสัญญาณที่เหมาะสมกับความถี่ของสัญญาณนั้น ๆ เพื่อให้เวลาแปลงสัญญาณกลับก็จะได้สัญญาณต้นฉบับที่ถูกต้องและครบถ้วน ซึ่งในสัญญาณเสียงแอนะล็อกนั้น จะประกอบด้วยสัญญาณในความถี่ต่าง ๆ ประกอบกัน หากอัตราที่เลือกใช้นั้นมีความถี่ไม่สูงพอ ก็จะไม่สามารถเก็บ sample ของสัญญาณในความถี่นั้นได้
ตัวอย่าง sample ที่ก่อให้เกิด aliasing ที่มา: Wikipedia
นอกจากนี้การเลือกอัตราสุ่มสัญญาณที่ไม่เหมาะสม ยังก่อให้เกิด aliasing หรือการที่ sample ที่สุ่มมานั้น สามารถแทนสัญญาณได้มากกว่าสัญญาณต้นฉบับที่ถูกสุ่มสัญญาณมา ทำให้สัญญาณที่ได้นั้นแตกต่างจากสัญญาณต้นฉบับที่ถูกสุ่มสัญญาณมา
ที่มา: Wikipedia
จากกราฟสเปกตรัมความถี่ด้านบน เมื่อสัญญาณต้นฉบับถูกสุ่มสัญญาณ (กราฟสีน้ำเงิน) จะทำให้เกิดสัญญาณที่มีลักษณะเหมือนกัน (alias) ที่ความถี่ของอัตราสุ่มสัญญาณขึ้น (กราฟสีเขียว) ซึ่งหากอัตราสุ่มสัญญาณที่ใช้นั้นมีความถี่น้อยเกินไป สัญญาณ alias ที่เกิดขึ้นจะไปหักล้างกับสัญญาณต้นฉบับ ทำให้สัญญาณมีความผิดเพี้ยนไป
ที่มา: Wikipedia
ด้วยเหตุนี้ ทฏษฏีการสุ่มตัวอย่าง (sampling theorem) จึงระบุให้ใช้ความถี่ของอัตราสุ่มมากเป็น 2 เท่าของความถี่ของสัญญาณต้นฉบับ เพื่อให้สัญญาณ alias ที่เกิดขึ้นไม่ไปทับซ้อนกับสัญญาณต้นฉบับ ทำให้สามารถใช้ low-pass filter (กราฟสีม่วง) เพื่อกรองเอาเฉพาะสัญญาณต้นฉบับเก็บไว้ได้
ค่าความถี่ของการสุ่มสัญญาณดังกล่าวเรียกว่า Nyquist Frequency ซึ่งตั้งชื่อตามชื่อผู้ค้นพบคือ Harry Nyquist วิศวกรไฟฟ้าชาวอเมริกาครับ
ตัวอย่างอัตราสุ่มสัญญาณที่นิยมใช้งาน เช่น
- 8,000 Hz ใช้ในงานสื่อสารทางโทรศัพท์และวิทยุ ครอบคลุมช่วงความถี่ของเสียงพูดปกติ (4,000 Hz)
- 44,100 Hz ใช้ในมาตรฐาน Audio CD ครอบคลุมช่วงความถี่เสียงที่มนุษย์ได้ยิน คือประมาณไม่เกิน 20,000 Hz ค่านี้ถูกเลือกใช้โดย Sony ผู้ร่วมประดิษฐ์ Audio CD เพราะสามารถใช้บันทึกเสียงลงในม้วนเทปวิดีโอด้วยอุปกรณ์อัดวิดีโอทั้งมาตรฐาน NTSC และ PAL ได้
- 48,000 Hz ใช้งานในกล้องวิดีโอและอุปกรณ์ระดับมืออาชีพ เพราะสามารถครอบคลุมความถี่ได้ถึง 22,000 Hz และใช้งานร่วมกับมาตรฐานเฟรมเรตวิดีโอต่าง ๆ ได้ดี
- 88,200 Hz สำหรับใช้งานกับอุปกรณ์ระดับมืออาชีพ ในอดีตนิยมใช้ เพราะมีความซับซ้อนในการลดอัตราสุ่มสัญญาณลงเหลือ 44,100 Hz เพื่อทำ Audio CD น้อยกว่า
- 96,000 Hz และ 192,000 Hz ใช้ในมาตรฐาน DVD-Audio เสียงในแผ่น DVD และ Blu-ray และอุปกรณ์ระดับมืออาชีพ
- 176,400 Hz ใช้ในมาตรฐาน HDCD และอุปกรณ์ระดับมืออาชีพสำหรับทำ Audio CD
- 352,800 Hz ใช้ในมาตรฐาน Digital eXtreme Definition (DXD) สำหรับบันทึก ตัดต่อและผสมเสียงเพื่อทำแผ่น Super Audio CD
ถึงแม้ว่าการใช้งานอัตราสุมสัญญาณสูง ๆ จะทำให้ต้องใช้กำลังในการประมวลผลสัญญาณ หน่วยความจำ และพื้นที่จัดเก็บมากขึ้น แต่ก็แลกกับการออกแบบ filter เพื่อกรองเอาช่วงความถี่เสียงที่ต้องการเก็บไว้นั้น สามารถทำได้ง่ายกว่า ซึ่งสาเหตุที่ทำได้ง่ายเพราะว่า การสร้าง filter เพื่อกรองช่วงความถี่ที่แคบมาก ๆ จะทำได้ยากกว่าช่วงความถี่ที่กว้างกว่า
ต่อไป เราจะไปดูขั้นตอนที่เหลือในการเข้ารหัสแบบ PCM กันครับ
ผมเรียนสายสุขภาพ อ่านจบ ก็งงดี แต่ก็จะเข้าใจบ้าง
Pingback: สัมภาษณ์คุณ Nageno Koji วิศวกรผู้อยู่เบื้องหลังหูฟังของ Sony
Pingback: มารู้จัก มาตรฐาน High Resolution Audio กันเถอะ
Pingback: มาทำความรู้จัก รูปแบบสัญญาณเสียง Direct Stream Digital (DSD) กันเถอะ | RE.V –>
Pingback: พาชมเครื่องเสียงพกพา Signature Series และหูฟังรุ่นใหม่ ๆ ของ Sony ประจำปี 2016 | RE.V –>
Pingback: ลองฟังเครื่องเล่นเพลง DMP-Z1 และหูฟัง IER-Z1R สมาชิกใหม่ Sony Signature Series | RE.V –>
ขอบคุณมากๆเลยครับ กำลังศึกษาแต่อ่านของภาษาอังกฤษแล้วงงมากครับ ต้องขอบคุณมากๆจากใจอีกครั้งครับ