ISSN: 2165- 7866
అబ్దల్లా బాలా మరియు అలైన్ అబ్రాన్
మల్టీ-ఆర్గనైజేషనల్ రిపోజిటరీలు, ప్రత్యేకించి ఇంటర్నేషనల్ సాఫ్ట్వేర్ బెంచ్మార్కింగ్ స్టాండర్డ్స్ గ్రూప్ (ISBSG) యొక్క రిపోజిటరీ వంటి స్వచ్ఛంద డేటా కంట్రిబ్యూషన్లపై ఆధారపడినవి, వాటి డేటా ఫీల్డ్ల కోసం పెద్ద సంఖ్యలో విలువలను కోల్పోవచ్చు, అలాగే కొన్ని అవుట్లయర్లను కూడా కలిగి ఉండవచ్చు. ఈ పత్రం ISBSG రిపోజిటరీతో అనుబంధించబడిన అనేక డేటా నాణ్యత సమస్యలను సూచిస్తుంది, ఇది బెంచ్మార్కింగ్ ప్రయోజనాల కోసం లేదా అంచనా నమూనాలను రూపొందించడం కోసం ఉపయోగించే వినియోగదారులకు ఫలితాలను రాజీ చేస్తుంది. వివరణాత్మక గణాంక విశ్లేషణ కోసం గుర్తించిన నమూనాల నాణ్యతను మెరుగుపరచడానికి డేటాను ప్రీప్రాసెసింగ్ చేయడానికి మేము అనేక ప్రమాణాలు మరియు సాంకేతికతలను ప్రతిపాదిస్తాము మరియు తప్పిపోయిన విలువలతో డేటాసెట్లతో వ్యవహరించడానికి బహుళ ఇంప్యుటేషన్ (MI) వ్యూహాన్ని ప్రదర్శిస్తాము.