अर्ध-संरचित डेटा वह डेटा है जो न तो कच्चा डेटा है, न ही पारंपरिक डेटाबेस सिस्टम में टाइप किया गया डेटा है। यह संरचित डेटा है, लेकिन यह किसी तर्कसंगत मॉडल में व्यवस्थित नहीं है, जैसे कि टेबल या ऑब्जेक्ट-आधारित ग्राफ़। वेब पर पाए जाने वाले बहुत से डेटा को अर्ध-संरचित के रूप में वर्णित किया जा सकता है। डेटा एकीकरण विशेष रूप से अर्ध-संरचित डेटा का उपयोग करता है।
अर्ध-संरचित डेटा के कुछ उदाहरण बिबटेक्स फ़ाइलें या मानक सामान्यीकृत मार्कअप भाषा (SGML) दस्तावेज़ होंगे। अर्ध-संरचित फ़ाइलों में रिकॉर्ड से बना तर्कसंगत डेटा हो सकता है, लेकिन वह डेटा पहचानने योग्य संरचना में व्यवस्थित नहीं हो सकता है। कुछ फ़ील्ड गायब हो सकते हैं या उनमें ऐसी जानकारी हो सकती है जिसे डेटाबेस सिस्टम में आसानी से वर्णित नहीं किया जा सकता है।
अर्ध-संरचित डेटा में, डेटा के भीतर निहित जानकारी आम तौर पर डेटाबेस स्कीमा से जुड़ी होती है। यही कारण है कि जानकारी को कभी-कभी स्व-वर्णनात्मक कहा जाता है।
0 Comments