fbpx
วิกิพีเดีย

Dynamic time warping

ไดนามิกไทม์วอร์ปปิง (อังกฤษ: Dynamic time warping : DTW) เป็นขั้นตอนวิธีสำหรับการเปรียบเทียบความคล้ายของลำดับที่มีความแตกต่างกันในด้านเวลาหรือความเร็ว เช่น รูปแบบการเดินของคนๆหนึ่งจะถูกนับว่ามีความคล้าย ไม่ว่าคนๆนั้นจะเดินอย่างรวดเร็ว เดินอย่างเชื่องช้า หรือแม้แต่เดินด้วยความเร่ง เมื่อพิจารณาจากผู้สังเกตเดียวกัน ซึ่งไดนามิกไทม์วอร์ปปิงสามารถนำไปประยุกต์ได้กับวิดีโอ เสียง และภาพ รวมไปถึงข้อมูลต่างๆที่สามารถแปลงให้อยู่ในรูปของข้อมูลเชิงเส้นได้ ตัวอย่างหนึ่งของการประยุกต์ขั้นตอนวิธีนี้ไปใช้คือ การรู้จำคำพูด โดยใช้ไดนามิกไทม์วอร์ปปิง เพื่อจัดการกับคำพูดที่มีความเร็วไม่เท่ากัน แม้จะสื่อความหมายเดียวกัน

รูปแบบของการจับคู่ลำดับของ DTW และ Euclidean

แนวคิดเบื้องต้น

โดยทั่วไปไดนามิกไทม์วอร์ปปิงเป็นวิธีที่ทำให้คอมพิวเตอร์สามารถหาการจับคู่ที่เหมาะสมของลำดับสองชุดได้ภายใต้ข้อจำกัด ลำดับเหล่านั้นจะถูกบิดเบือน (warp) แบบไม่คงที่ในหน่วยของเวลา เพื่อที่จะพิจารณาความคล้ายจากการกระจายแบบไม่คงที่ในหน่วยของเวลา โดยจะให้ผลลัพธ์ออกมาเป็นระยะทางและวิถีการปรับแนว (alignment) ที่ดี่สุด ซึ่งวิธีการพิจารณาลำดับเช่นนี้พบได้บ่อยครั้งใน แบบจำลองฮิดเดนมาร์คอฟ (hidden Markov models)

ขั้นตอนวิธี

เป้าหมายของไดนามิกไทม์วอร์ปปิง คือ เพื่อเปรียบเทียบลำดับที่ขึ้นอยู่กับเวลาสองชุด

  ด้วยความยาว   ซึ่งเป็นจำนวนเต็ม
  ด้วยความยาว   ซึ่งเป็นจำนวนเต็ม

โดยลำดับเหล่านี้อาจจะเป็นสัญญาณที่ไม่ต่อเนื่อง (อนุกรมเวลา) หรือ ลำดับของลักษณะเฉพาะ (feature) ที่ถูกสร้างขึ้นตามช่วงเวลา กำหนดให้ปริภูมิของลักษณะเฉพาะแทนด้วย   ดังนั้น   สำหรับ   และ   เพื่อที่จะเปรียบเทียบลักษณะเฉพาะ   จึงจำเป็นที่จะต้องคำนวณต้นทุนเฉพาะส่วน (local cost measure) หรือเรียกอีกอย่างได้ว่า การคำนวณระยะทางเฉพาะส่วน (local distance measure) ซึ่งนิยามได้เป็นฟังก์ชัน   ซึ่งโดยทั่วไป   จะมีค่าน้อย ถ้า   และ   มีความคล้ายกันมาก ซึ่งสำหรับแต่ละคู่ของลำดับทั้งสอง นำไปสร้าง เมทริกซ์ต้นทุน (cost matrix)   นิยามด้วย   ดังรูป

 
เมทริกซ์ต้นทุนของลำดับ   และ   บริเวณสีเข้มในเมทริกซ์แสดงถึงส่วนที่มีต้นทุนต่ำ และบริเวณสีอ่อนแสดงถึงส่วนที่มีต้นทุนสูง

โดยเป้าหมายต่อไปคือการหาวิถีการปรับแนวระหว่าง   และ   ที่มีต้นทุนรวมน้อยที่สุด โดยปกติแล้ว วิถีการปรับแนว จะวิ่งไปตามทางที่ต้นทุนต่ำภายในเมทริกซ์ต้นทุน ด้วยรูปแบบดังนี้

เส้นทางบิดเบือน   เป็นลำดับ   และ   สำหรับ  จะสนใจเงื่อนไขดังต่อไปนี้

  1. เงื่อนไขขอบเขต (Boundary condition) :   และ  
  2. เงื่อนไขทางเดียว (Monotonicity condition) :   และ  
  3. เงื่อนไขขนาดการเดิน (step size condition) :   สำหรับ  

ซึ่งจะได้ตัวอย่างของเส้นทางบิดเบือนแบบต่างๆภายใต้เงื่อนไขดังรูป

 
เส้นทางการบิดเบือนภายใต้เงื่อนไขแบบต่างๆ

โดยต้นทุนทั้งหมดของเส้นทางบิดเบือน   ระหว่าง   และ   ซึ่งเกี่ยวเนื่องกับการวัดต้นทุนเฉพาะส่วน   จะถูกนิยามด้วย
 

สำหรับ เส้นทางบิดเบือนที่เหมาะสมระหว่าง   และ   คือระยะทางบิดเบือน   ซึ่งมีต้นทุกต่ำที่สุดเมื่อเทียบกับเส้นทางบิดเบือนทั้งหมดที่เป็นไปได้ ระยะทางไดนามิกไทม์วอร์ปปิง   ระหว่าง   และ   จะถูกนิยามเป็นต้นทุนทั้งหมดของ   โดย

   
   เป็นเส้นทางบิดเบือน  


ซึ่งสุดท้ายแล้วจะได้ระยะทางบิดเบือนที่เหมาะสมดังรูป

 
เส้นสีขาวในรูปแสดงถึงเส้นทางไดนามิกไทม์วอร์ปปิงบนเมทริกซ์ต้นทุน

ความซับซ้อนเชิงเวลา

ขั้นตอนวิธีไดนามิกไทม์วอร์ปปิงแบบทั่วไปจะมีอัตราการเติบโตแบบชี้กำลัง แต่เมื่อใช้กำหนดการพลวัตในการแก้ปัญหาจะมีความซับซ้อนเชิงเวลาเป็น   เมื่อ   และ   แทนความยาวของข้อมูลในแต่ละลำดับ

การประยุกต์ใช้และโอเพนซอร์ซที่เกี่ยวข้อง

  • lbimproved ไลบรารีภาษา C++ ได้นำเอาขั้นตอนวิธี Fast Nearest-Neighbor Retrieval มาใช้ภายใต้ไดนามิกส์ไทม์วอร์ปปิง (GPL) อีกทั้งยังได้จัดเตรียมไดนามิกส์ไทม์วอร์ปปิงไว้ให้ใช้ด้วยภาษา C++
  • R package dtw ได้นำเอาขั้นตอนวิธีในตระกูลไดนามิกไทม์วอร์ปปิงหลากหลายรูปแบบมาใช้งาน รวมไปถึงกฎการเรียกซ้ำ และการจับคู่สายอักขระย่อย
  • mlpy ไลบรารี ภาษา Python ซึ่งได้นำเอาขั้นตอนวิธีไดนามิกไทม์วอร์ปปิงมาใช้
  • kinectdtw โอเพนซอร์ซ เกี่ยวกับการรู้จำท่าทางที่ได้นำเอาขั้นตอนวิธีไดนามิกไทม์วอร์ปปิงมาใช้
  • Chula Engineering Newsletter วารสารทางวิชาการของคณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ซึ่งได้กล่าวถึงการนำไดนามิกไทม์วอร์ปปิงไปประยุกต์ใช้ในด้านต่างๆ เช่น ค้นหาฐานข้อมูล การรู้จำเสียงพูด วิเคราะห์ข้อมูลทางสถิติ

ดูเพิ่ม

  • Hidden Markov model
  • Speech recognition
  • Time series

อ้างอิง

  • Sakoe, H. and Chiba, S., Dynamic programming algorithm optimization for spoken word recognition, IEEE Transactions on Acoustics, Speech and Signal Processing, 26 (1) pp. 43- 49, 1978, ISSN: 0096-3518
  • C. S. Myers and L. R. Rabiner.
    A comparative study of several dynamic time-warping algorithms for connected word recognition.
    The Bell System Technical Journal, 60 (7) :1389-1409, September 1981.
  • L. R. Rabiner and B. Juang.
    Fundamentals of speech recognition.
    Prentice-Hall, Inc., 1993 (Chapter 4)
  • Müller, Meinard, Information Retrieval for Music and Motion, 2007 (Chapter 4)
  • เทคนิคการใช้ไดนามิกไทม์วอร์ปปิงในการทำเหมืองข้อมูลอนุกรมเวลา Time Series Mining using Dynamic Time Warping Technique, Chula Engineering Newsletter

dynamic, time, warping, งก, ามภาษา, ในบทความน, ไว, ให, านและผ, วมแก, ไขบทความศ, กษาเพ, มเต, มโดยสะดวก, เน, องจากว, เด, ยภาษาไทยย, งไม, บทความด, งกล, าว, กระน, ควรร, บสร, างเป, นบทความโดยเร, วท, ดไดนาม, กไทม, วอร, ปป, งกฤษ, เป, นข, นตอนว, สำหร, บการเปร, ยบเท, ย. lingkkhamphasa inbthkhwamni miiwihphuxanaelaphurwmaekikhbthkhwamsuksaephimetimodysadwk enuxngcakwikiphiediyphasaithyyngimmibthkhwamdngklaw krann khwrribsrangepnbthkhwamodyerwthisudidnamikithmwxrpping xngkvs Dynamic time warping DTW epnkhntxnwithisahrbkarepriybethiybkhwamkhlaykhxngladbthimikhwamaetktangknindanewlahruxkhwamerw echn rupaebbkaredinkhxngkhnhnungcathuknbwamikhwamkhlay imwakhnnncaedinxyangrwderw edinxyangechuxngcha hruxaemaetedindwykhwamerng emuxphicarnacakphusngektediywkn sungidnamikithmwxrppingsamarthnaipprayuktidkbwidiox esiyng aelaphaph rwmipthungkhxmultangthisamarthaeplngihxyuinrupkhxngkhxmulechingesnid twxyanghnungkhxngkarprayuktkhntxnwithiniipichkhux karrucakhaphud odyichidnamikithmwxrpping ephuxcdkarkbkhaphudthimikhwamerwimethakn aemcasuxkhwamhmayediywknrupaebbkhxngkarcbkhuladbkhxng DTW aela Euclidean enuxha 1 aenwkhidebuxngtn 2 khntxnwithi 3 khwamsbsxnechingewla 4 karprayuktichaelaoxephnsxrsthiekiywkhxng 5 duephim 6 xangxingaenwkhidebuxngtn aekikhodythwipidnamikithmwxrppingepnwithithithaihkhxmphiwetxrsamarthhakarcbkhuthiehmaasmkhxngladbsxngchudidphayitkhxcakd ladbehlanncathukbidebuxn warp aebbimkhngthiinhnwykhxngewla ephuxthicaphicarnakhwamkhlaycakkarkracayaebbimkhngthiinhnwykhxngewla odycaihphllphthxxkmaepnrayathangaelawithikarprbaenw alignment thidisud sungwithikarphicarnaladbechnniphbidbxykhrngin aebbcalxnghidednmarkhxf hidden Markov models khntxnwithi aekikhepahmaykhxngidnamikithmwxrpping khux ephuxepriybethiybladbthikhunxyukbewlasxngchud X x 1 x 2 x N displaystyle X x 1 x 2 x N dwykhwamyaw N displaystyle N sungepncanwnetmY y 1 y 2 y M displaystyle Y y 1 y 2 y M dwykhwamyaw M displaystyle M sungepncanwnetmodyladbehlanixaccaepnsyyanthiimtxenuxng xnukrmewla hrux ladbkhxnglksnaechphaa feature thithuksrangkhuntamchwngewla kahndihpriphumikhxnglksnaechphaaaethndwy F displaystyle F dngnn x n y m F displaystyle x n y m in F sahrb n 1 N displaystyle n in 1 N aela m 1 M displaystyle m in 1 M ephuxthicaepriybethiyblksnaechphaa x y F displaystyle x y in F cungcaepnthicatxngkhanwntnthunechphaaswn local cost measure hruxeriykxikxyangidwa karkhanwnrayathangechphaaswn local distance measure sungniyamidepnfngkchn c F F R 0 displaystyle c F times F rightarrow R geqslant 0 sungodythwip c x y displaystyle c x y camikhanxy tha x displaystyle x aela y displaystyle y mikhwamkhlayknmak sungsahrbaetlakhukhxngladbthngsxng naipsrang emthrikstnthun cost matrix C R N M displaystyle C in R N times M niyamdwy C n m c x n y m displaystyle C n m c x n y m dngrup emthrikstnthunkhxngladb X displaystyle X aela Y displaystyle Y briewnsiekhminemthriksaesdngthungswnthimitnthunta aelabriewnsixxnaesdngthungswnthimitnthunsung odyepahmaytxipkhuxkarhawithikarprbaenwrahwang X displaystyle X aela Y displaystyle Y thimitnthunrwmnxythisud odypktiaelw withikarprbaenw cawingiptamthangthitnthuntaphayinemthrikstnthun dwyrupaebbdngniesnthangbidebuxn N M displaystyle N M epnladb p p 1 p L displaystyle p p 1 p L aela p l n l m l 1 N 1 M displaystyle p l n l m l in 1 N times 1 M sahrb l 1 L displaystyle l in 1 L casnicenguxnikhdngtxipni enguxnikhkhxbekht Boundary condition p 1 1 1 displaystyle p 1 1 1 aela p L N M displaystyle p L N M enguxnikhthangediyw Monotonicity condition n 1 n 2 n L displaystyle n 1 leqslant n 2 leqslant leqslant n L aela m 1 m 2 m L displaystyle m 1 geqslant m 2 geqslant geqslant m L enguxnikhkhnadkaredin step size condition p l 1 p l 1 0 0 1 1 1 displaystyle p l 1 p l in 1 0 0 1 1 1 sahrb l 1 L 1 displaystyle l in 1 L 1 sungcaidtwxyangkhxngesnthangbidebuxnaebbtangphayitenguxnikhdngrup esnthangkarbidebuxnphayitenguxnikhaebbtang odytnthunthnghmdkhxngesnthangbidebuxn p displaystyle p rahwang X displaystyle X aela Y displaystyle Y sungekiywenuxngkbkarwdtnthunechphaaswn c displaystyle c cathukniyamdwyc p X Y l 1 L c x n l y n l displaystyle c p X Y sum l 1 L c x n l y n l sahrb esnthangbidebuxnthiehmaasmrahwang X displaystyle X aela Y displaystyle Y khuxrayathangbidebuxn p displaystyle p sungmitnthuktathisudemuxethiybkbesnthangbidebuxnthnghmdthiepnipid rayathangidnamikithmwxrpping D T W X Y displaystyle DTW X Y rahwang X displaystyle X aela Y displaystyle Y cathukniyamepntnthunthnghmdkhxng p displaystyle p ody D T W X Y displaystyle DTW X Y c p X Y displaystyle c p X Y m i n c p X Y p displaystyle min c p X Y p epnesnthangbidebuxn N M displaystyle N M sungsudthayaelwcaidrayathangbidebuxnthiehmaasmdngrup esnsikhawinrupaesdngthungesnthangidnamikithmwxrppingbnemthrikstnthunkhwamsbsxnechingewla aekikhkhntxnwithiidnamikithmwxrppingaebbthwipcamixtrakaretibotaebbchikalng aetemuxichkahndkarphlwtinkaraekpyhacamikhwamsbsxnechingewlaepn O M N displaystyle O MN emux M displaystyle M aela N displaystyle N aethnkhwamyawkhxngkhxmulinaetlaladbkarprayuktichaelaoxephnsxrsthiekiywkhxng aekikhlbimproved ilbrariphasa C idnaexakhntxnwithi Fast Nearest Neighbor Retrieval maichphayitidnamiksithmwxrpping GPL xikthngyngidcdetriymidnamiksithmwxrppingiwihichdwyphasa C R package dtw idnaexakhntxnwithiintrakulidnamikithmwxrppinghlakhlayrupaebbmaichngan rwmipthungkdkareriyksa aelakarcbkhusayxkkhrayxy mlpy ilbrari phasa Python sungidnaexakhntxnwithiidnamikithmwxrppingmaich kinectdtw oxephnsxrs ekiywkbkarrucathathangthiidnaexakhntxnwithiidnamikithmwxrppingmaich Chula Engineering Newsletter warsarthangwichakarkhxngkhnawiswkrrmsastr culalngkrnmhawithyaly sungidklawthungkarnaidnamikithmwxrppingipprayuktichindantang echn khnhathankhxmul karrucaesiyngphud wiekhraahkhxmulthangsthitiduephim aekikhHidden Markov model Speech recognition Time seriesxangxing aekikhSakoe H and Chiba S Dynamic programming algorithm optimization for spoken word recognition IEEE Transactions on Acoustics Speech and Signal Processing 26 1 pp 43 49 1978 ISSN 0096 3518 C S Myers and L R Rabiner A comparative study of several dynamic time warping algorithms for connected word recognition The Bell System Technical Journal 60 7 1389 1409 September 1981 L R Rabiner and B Juang Fundamentals of speech recognition Prentice Hall Inc 1993 Chapter 4 Muller Meinard Information Retrieval for Music and Motion 2007 Chapter 4 ethkhnikhkarichidnamikithmwxrppinginkarthaehmuxngkhxmulxnukrmewla Time Series Mining using Dynamic Time Warping Technique Chula Engineering Newsletterekhathungcak https th wikipedia org w index php title Dynamic time warping amp oldid 7127865, wikipedia, วิกิ หนังสือ, หนังสือ, ห้องสมุด,

บทความ

, อ่าน, ดาวน์โหลด, ฟรี, ดาวน์โหลดฟรี, mp3, วิดีโอ, mp4, 3gp, jpg, jpeg, gif, png, รูปภาพ, เพลง, เพลง, หนัง, หนังสือ, เกม, เกม