-تبدیل فوریه :
بدست آوردن طیف فرکانسی موج صوتی در گوش بصورت مکانیکی صورت می گیرد.
در ریاضیات با استفاده از تبدیلهای فوریه و در کامپیوتر با استفاده از FFT ( Fast Fourier Transform) این امر صورت میگیرد.
ساختار صوت :
صوت ارتعاشی است که در هوا منتشر می شود.
( یا در محیط های فیزیکی دیگر به جز خلا ) اغلب صداها در طبیعت طیف فرکانسی مشخصی ندارند و اطلاعات مفید کمی را شامل می شوند .
صداهای با طیف فرکانسی مشخص محتوی اطلاعات بیشتری هستند .
برای شناخت اهمیت فرکانس در صدا باید در مورد نحوه تولید ودریافت صوت بررسی صورت گیرد.
بسیاری از اشیا در زمان نوسان ، امواج صوتی تولید
می کنند .
وقتی صحبت می کنیم یا آواز می خوانیم تارهای صوتی به ارتعاش در می آیند و صدا در گلو دهان و بینی نوسان می کند.
آنچه مهم است این است که تکرار حرکت یک شکل موج باعث تشخیص صوت از نویز می شود .
هر صوت فرازو فرودی دارد .
بوسیله فرکانس مشخص می شود که شکل موج به چه صورت تکرار می شود .
روشی که گوش فرکانسهای مختلف را تفکیک می کند جالب توجه است .
مبنای آن بر اصل تشدید ( رزونانس ) استوار است .
ضربه یک جسم با فرکانس خاص را به ارتفاش وا می دارد.
همچنین آن جسم با موج صوتی با فرکانس مشابه شروع به نوسان می کند .
به عنوان مثال اگر به یک لیوان شیشه ای ضربه وارد کنیم صدایی از آن متصاعد می شود .
اگر سعی کنیم همان صدا را تولید کنیم و لیوان را در معرض آن قرار دهیم لیوان شروع به ارتعاش می کند .
مولکولهای هوا که توسط ارتعاشات صوتی مرتعش شده اند سطح لیوان را دچار فشار و کشش می کنند .
هنگامی که این کشش وفشارهای کوچک منطبق با فرکانس طبیعی لیوان باشند می توانند لیوان را تحریک به نوسان کنند.
در گوش تشدید در داخلی ترین بخش گوش که حلزون گوش نامیده می شود اتفاق میافتد .
قسمتهای مختلف این بخش حلزونی شکل با فرکانسهای مختلف نوسان می کنند.
وقتی یک قسمت خاص از حلزون گوش شروع به تشدید می کند گیرنده های عصبی که در آنجا قرار دارند سیگنال را دریافت می کنند و آنرا به مغز می فرستند .
اغلب صداها به یکباره در مناطق مختلف حلزون گوش تشدید ایجاد میکنند که این صداها بصورت مختلط شنیده می شود.
1-2 -نمونه گیری صدا :
امروزه اغلب صدا بصورت دیجیتالی ذخیره میشود .
ابتدا میکروفن صوت را به جریانهای الکتریکی تبدیل می کند.
نوسان متوالی فشار هوا به نوسان متوالی ولتاژ در یک مدار الکتریکی تبدیل می شود .
این تغییرات سریع ولتاژ در یک مبدل آنالوگ به دیجیتال به یک سری از اعداد تبدیل می شود.
عملکرد مبدل ADC شبیه یک ولتمتر دیجیتال است که تعداد زیادی اندازه گیری در ثانیه انجام میدهد .
هر یک از نتایج اندازه گیری بصورت یک عدد ذخیره میشود .
این اعداد نمونه یا سمپل نامیده می شوند .
تبدیل کامل یک صدا به یک سری از اعداد ، نمونه گیری (Sampling) نامیده می شود .
کارت صدا در کامپیوتر در واقع یک مبدل دیجیتال کننده است که جریانی از سمپل ها را تولید می کند که بوسیله نرم افزار سیستم می تواند مورد استفاده قرار گیرد .
مثال :
به عنوان نمونه وضعیت ضبط موسیقی در یک CD را مورد بررسی قرار میدهیم .
موسیقی بصورت 44100 سمپل در ثانیه ضبط می شود که هر نمونه بصورت 16 بیت ذخیره می شوند .
در ضبط استریو این میزان دو برابر می شود.
به بیان دیگر برای ضبط موسیقی بصورت استریو برای یک ساعت به635,000,000 بایت فضا نیاز است .
1-3 -بردارها و موج ضربه ای :
صدا در کامپیوتر در بافرهای حاوی سمپل ذخیره می شود .
یک سری از اعداد صحیح که هر یک متناظر با دامنه صدا در یک لحظه مجزا است .
یک بردار را می توان بصورت آرایه ای از اعداد نمایش داد .
1-3-1 -آنالیز بردار ضربه : یک بافر را که حاوی سمپل های یک صوت است در نظر بگیرید .
اگر بافرشامل n نمونه باشد می توان آنرا بصورت یک بردار n بعدی نمایش داد.
هر نمونه معرف یک مختصات در فضای n بعدی است .
در صورتیکه تنها بافرهای با سه سمپل را در نظر بگیریم سمپل ها ، مختصات X ،Y و Z یک بردار سه بعدی می شوند .
به طور معمول صدها سمپل در یک بافر داریم .
همچنین تصور یک فضای n بعدی که یک بردار را تشکیل داده اند مشکل است .
از نظر ریاضی با محاسبه مجدد مختصات بردار سمپل ها که از بردارهای مبنا مخنلف در فضای n – بعدی استفاده میکنند تبدیل موج ضربه ای بدست می آید که نتیجه بصورت n شماره خواهد بود .
1-3-2- تبدیل موج ضربه ای 8 – نقطه ای : در صورتیکه یک بافر با 8 سمپل در نظر گرفته شود که سمپل ها پی در پی در آن قرار دارند برای رسم بافر بصورت یک بردار n – بعدی سمپل ها بصورت 8 بخش عمودی یکی پس از دیگری نشان داده می شوند.
n بردار مبنا که معرف سمپل ها هستند می توانند در روش مشابهی نشان داده شوند .
روشی که اغلب در آنالیز موج ضربه ای بکار می رود مبنای Haar است .
این مبناهای خاص عمود بر محور هستند .
ضرب داخلی هر جفت از آنها صفر و ضرب داخلی هر یک در خودش مساوی یک است .
برای مثال آخرین بردار مبنا در تصویر فوق مشخصات زیر را دارا می باشد : i8 = (0, 0, 0, 0, 0, 0, a, -a), a = 1/√2 (i8*i8) = 02 + 02 + 02 + 02 + 02 + 02 + a2 + a2 = 2 * a2 = 1 از ضرب داخلی بردار اختیاری V به مختصاتv = (v1, v2, v3, v4, v5, v6, v7, v8)با n امین بردار مبنا ، ضریب موج ضربه ای هشتم موج V را حساب می کنیم : w8 = (v * i8) = (v7 - v8)/√2 این ضرب تفاوت بین هفتمین و هشتمین ضریب بردار که معرف تفاوت سمپل ها در بافر محتوی سمپل ها هستند را نشان می دهد .
اگر تغییرات سیگنال آهسته باشد این اختلاف خیلی کوچک خواهد بود .
با توجه به تصاویر بردارهای مبنا می توان ضرایب موج ضربه ای اول را بدست آورد .
( ضرب داخلی V با in ) ضریب اول میانگین دامنه سیگنال و ضریب دوم اختلاف بین نیمه نخست سیگنال و نیمه دوم آن را بیان می کند .
به این ترتیب تصویر کلی سیگنال بدست می آید .
یک سری از ضرایب موج ضربه ایw1, w2, ...
w8 تبدیل موج ضربه ای سیگنال V نامیده می شود.
چون بافرهای با 8 سمپل مد نظر است آنرا تبدیل موج ضربه ای 8 نقطه ای می نامیم .
برای بدست آوردن سیگنالی که ضرایب موج ضربه ای آن داده شده است بردارهای مبنا را در ضرایب آنها ضرب کرده و با هم جمع میشود.
v = w1 i1 + w2 i2 + ...
+ w8 i8 فصل دوم تحلیل فوریه 2-1- تحلیل فوریه : تبدیل فوریه مورد خاص تبدیل موج با بردارهای مبنا با توابع مثلثاتی Sin و Cos است .
با دقت در اسیلاتور هارمونیک مشاهده می شود وقتی اجسام نوسان می کنند حرکت آنها تابع توابع مثلثاتی است .
2-1-1 - تشدید : هنگامی که یک موج صوتی به یک اسیلاتور اثر می کند ممکن است نوسانگر را تحریک کند .
وقتی موج صوتی نوسانگر را تحریک کرد اسیلاتور شروع به نوسان با مشخصه فرکانسی خودش می کند .
نوسان اسیلاتور مبین این مطلب است که موج صوتی محتوی مولفه فرکانسی نوسانگر است .
موج صوتی می تواند یک موج پیچیده باشد که شباهتی به موج سینوسی ندارد ولی در هر صورت در خودش یک مولفه فرکانسی مشخص دارد .
چون موج صوتی اسیلاتور را به نوسان وا می دارد باید به طور پیوسته انرژی خود را به اسیلاتور منتقل نماید .موج صوتی اسیلاتور را دچار آونگ می کند .
می توان مشخص کرد صوت مشخصه فرکانسی لازم برای نوسان اسیلاتور را دارد یا نه .
تنها بایستی نمونه های متوالی صوت را در وزن های مخصوص ضرب نموده و آنها را با هم تلفیق کنیم .
وقتی نوسانگر در نیمه نخست پریود قرار دارد این وزن ها مثبت در نظر گرفته می شود و در نیمه دوم پریود این وزنها را منفی در نظر می گیریم .
از آنجایی که بهترین زمان انتقال انرژی وقتی است که نوسانگر در نیمه نوسان است بلندترین وزن در این نقطه در نظر گرفته می شود .
همه این موارد در نظر گرفته می شود تا بهترین تابع وزن بدست آید .
این تابع را بصورت سینوسی در نظر می گیریم .
وقتی صوت شامل فرکانس مشخصی نباشد این جمع نزدیک صفر می شود .
نمونه های مثبت بطور متوسط نمونه های منفی را خنثی می کنند .
اگر یک همبستگی بین صوت و توابع وزنها باشد این همبستگی تلفیق می شود و نتیجه ممکن است یک عدد بزرگ باشد .
در صورتیکه یک صوت را از نظر فیزیکی آنالیز کنیم بایستی یک سری نوسانگر که هر یک اندکی در فرکانس با هم تفاوت دارند در نظر گرفته شود .
در صورتیکه صوت آنها را به نوسان وا دارد هر فرکانسی که در موج صوتی وجود دارد نوسانگر نظیر آن را به حرکت در می آورد .
به جای استفاده از اسیلاتورها که با فرکانسهای اندکی متفاوت وفق داده شده اند میتوان موج صوتی را با استفاده از ریاضیات تحلیل کرد تا بدست آید کدام اسیلاتورها باید تحریک شوند .
هر اسیلاتور نظیر یک تابع وزن سینوسی با فرکانس مشخص است .
اگر صوت بصورت دیجیتال باشد میتوان نمونه های آنرا در اوزان نظیر آن ضرب کرد وبا هم تلفیق نمود .
بدون دیجیتال سازی باید موج صوتی را در تابع سینوسی ضرب کرد و سپس انتگرالگیری نمود .
اعداد حاصله نشان میدهد چه مقدار از فرکانسهای معین در یک موج صوتی خاص وجود دارد .
یک سری از چنین اعدادی با فرکانسهای مختلف نظیر آن تبدیل فوریه ( به عبارت بهتر تبدیل فوریه دیجیتال DFT ) یا طیف فرکانسی صوت نامیده می شود .
توابع سینوسی به تنهایی کافی نیستند برای تکمیل باید توابع کسینوسی را اضافه نماییم اگر چه نظیر فرکانس نمودارهای سینوسی باشد .
توابع کسینوسی همفاز نبودن نوسان اسیلاتورها را نشان می دهند .
2-2- ترکیب فوریه : موج ضربه ای فوریه یک دستگاه متعامد را نشان می دهد .
در صورتیکه ضرب اسکالر به کار رود ضرب عددی دو بردار صفر می شود .
همچنین با نرمالیزاسیون مناسب میتوان مربعات این بردارها را مساوی یک بدست آورد .
هر بافر با n نمونه می تواند به n بردار که n عدد می دهد تبدیل شود .
این اعداد ضرایب فوریه هستند .
این اعداد تبدیل فوریه دیجیتال بافر را شکل میدهد .
به طور معکوس با داشتن این اعداد میتوان بافر را بازسازی نمود .
کافی است هر بردار پایه در ضریب فوریه نظیر آن ضرب شود و همه را با هم تلفیق کرد تا یک بردار n بعدی بدست آید که دقیقا معادل بافر اصلی است .
عملیات بازسازی موج صوتی از ضرایب فوریه آن ترکیب فوریه نامیده می شود .
هر بردار مبنا یک موج نمونه سینوسی با فرکانس معین است .
با اضافه کردن این امواج بهم با ضرایب مناسب میتوان هر موج صوتی را دوباره بازسازی کرد .
فصل سوم تبدیل فوریه دیجیتال 3-1- تبدیل فوریه دیجیتال : مبانی فوریه بر نمونه های توابع سینوسی و کسینوسی مبتنی است .
با استفاده از اعداد مختلط این دو می توانند با هم ترکیب شوند و به صورت یک تابع نمایی نشان داده شوند .
برای نمونه یک تبدیل فوریه چهار نقطه ای در نظر گرفته می شود .
به چهار بردار مبنای ek, k = 0...3 نیاز است که نمونه های نمایی فرکانسهای صعودی هستند .
ek = (e-2πi(0*k)/4, e-2πi(1*k)/4, e-2πi(2*k)/4, e-2πi(3*k)/4) اینها چهار مثال از تابع نمایی e-2πitk/4 هستند که در آن t = 0, 1, 2, 3 .
در اینصورت خواهیم داشت : e0 = (1, 1, 1, 1) e1 = (1, e-2πi/4, e-2πi2/4, e-2πi3/4) e2 = (1, e-2πi2/4, e-2πi4/4, e-2πi6/4) e3 = (1, e-2πi3/4, e-2πi6/4, e-2πi9/4) جزء حقیقی و موهومی توابع فوق به شکل زیر ساده می شود : در حقیقت 4 بردار مبنای مستقل در فضای 4 بعدی وجود دارد .
در زیر قسمت حقیقی بردارهای مبنا دیده می شود که با توابع مثلثاتی مناسب تطبیق دارند .
این مطلب که این بردارها بسیار منظم هستند اساس الگوریتم FFT را شکل می دهد .
پیش از پرداختن به الگوریتم لازم است چند نماد مناسب معرفی شوند .
تمام بردارهای مبنا در فضای N – بعدی می توانند