રીગ્રેસન એનાલિસ્ટ્સ ચલો વચ્ચે સંબંધો
રીગ્રેસન એક ડેટા માઇનિંગ ટેકનિક છે જેનો ઉપયોગ ચોક્કસ ડેટાસેટને આપવામાં આવે છે તે આંકડાકીય મૂલ્યોની શ્રેણી (જેને સતત મૂલ્ય પણ કહેવાય છે) ની આગાહી કરવામાં આવે છે. ઉદાહરણ તરીકે, રીગ્રેસનનો ઉપયોગ અન્ય વેરિયેબલ્સને આધારે ઉત્પાદન અથવા સેવાની કિંમતની આગાહી કરવા માટે થઈ શકે છે.
રીગ્રેસનનો વેપાર અને માર્કેટિંગ આયોજન, નાણાકીય આગાહી, પર્યાવરણીય મોડેલિંગ અને વલણોનું વિશ્લેષણ માટે બહુવિધ ઉદ્યોગોમાં ઉપયોગ થાય છે.
રીગ્રેસન વિ. વર્ગીકરણ
રીગ્રેસન અને ક્લાસિફિકેશન ડેટા માઇનિંગ તકનીકો સમાન સમસ્યાઓ ઉકેલવા માટે ઉપયોગમાં લેવામાં આવે છે, પરંતુ તે વારંવાર ગૂંચવણમાં છે. બંનેનો ઉપયોગ આગાહી વિશ્લેષણમાં થાય છે, પરંતુ રીગ્રેસનનો ઉપયોગ આંકડાકીય અથવા સતત મૂલ્યની આગાહી કરવા માટે કરવામાં આવે છે જ્યારે વર્ગીકરણ અસતત શ્રેણીઓમાં ડેટા સોંપે છે.
ઉદાહરણ તરીકે, રીગ્રેસનનો ઉપયોગ તેના સ્થાન, ચોરસ ફીટ, છેલ્લાં સમયે વેચવામાં આવતા ભાવ, સમાન ઘરોની કિંમત અને અન્ય પરિબળો પર આધારિત ઘરનું મૂલ્યાંકન કરવા માટે કરવામાં આવશે. વર્ગીકરણને ક્રમમાં રાખવું જોઈએ જો તમે તેના બદલે ઘરોને કેટેગરીમાં ગોઠવવા માગતા હો, જેમ કે વોકબિલિટી, લોટ સૉસ અથવા અપરાધ દરો.
રીગ્રેસન પઘ્ઘતિના પ્રકારો
રીગ્રેસનનો સૌથી સરળ અને સૌથી જૂની ફોર્મ રેખીય રીગ્રેસન છે જેનો ઉપયોગ બે વેરિયેબલ્સ વચ્ચે સંબંધનો અંદાજ કાઢવા માટે થાય છે. આ ટેકનીક એક સીધી રેખા (y = mx + b) ના ગાણિતિક સૂત્રનો ઉપયોગ કરે છે. સાદા શબ્દોમાં, તેનો અર્થ એ કે, વાય અને એક એક્સ-અક્ષ સાથે આલેખ આપવામાં આવ્યો છે, એક્સ અને વાય વચ્ચેનો સંબંધ થોડા આઉટલેઅર સાથે સીધી રેખા છે. ઉદાહરણ તરીકે, આપણે ધારવું જોઈએ કે, વસ્તીમાં વધારો થયો છે, ખોરાકનું ઉત્પાદન સમાન દરે વધશે - આ માટે બે આંકડા વચ્ચે મજબૂત, સુરેખ સંબંધ જરૂરી છે. આને વિઝ્યુઅલાઈઝ કરવા માટે, ગ્રાફને ધ્યાનમાં લો કે જેમાં Y- અક્ષની વસ્તીમાં વધારો થાય છે, અને એક્સ-અક્ષ ખોરાકનું ઉત્પાદન કરે છે. વાય મૂલ્ય વધતું જાય તેમ, X મૂલ્ય એ એક જ દરે વધશે, જે તેમની વચ્ચે સીધી રેખા બનાવશે.
ઉન્નત તકનીકો, જેમ કે બહુવિધ રીગ્રેસન, બહુવિધ વેરિયેબલ્સ વચ્ચેના સંબંધની આગાહી કરે છે - ઉદાહરણ તરીકે, શું આવક, શિક્ષણ અને ત્યાં રહેવાની પસંદગી વચ્ચેનો સંબંધ છે? વધુ ચલોનું ઉમેરણ નોંધપાત્ર રીતે આગાહીની જટિલતાને વધારે છે. પ્રમાણભૂત, અધિક્રમિક, સેટવુડ અને પગલાવાર સહિતની બહુવિધ રીગ્રેસન તકનીકોના વિવિધ પ્રકારો છે, દરેક તેની પોતાની એપ્લિકેશન સાથે.
આ બિંદુએ, અમે આગાહી કરવાનો પ્રયાસ કરી રહ્યા છીએ તે મહત્વનું છે (આશ્રિત અથવા અનુમાનિત ચલ) અને અમે આગાહી (સ્વતંત્ર અથવા આગાહી ચલો) બનાવવા માટે ઉપયોગમાં લઈએ છીએ તે ડેટા. અમારા ઉદાહરણમાં, અમે આ સ્થાનની આગાહી કરવા માંગીએ છીએ જ્યાં એક આવક અને શિક્ષણ ( આગાહી ચલો બંને) આપવામાં આવે છે ( આગાહી ચલ) રહેવા માટે પસંદ કરે છે.
- સ્ટાન્ડર્ડ બહુવિધ રીગ્રેસન એક જ સમયે તમામ આગાહી ચલોને ગણવામાં આવે છે. ઉદાહરણ તરીકે, 1) આવક અને શિક્ષણ (આગાહીઓ) અને પડોશની પસંદગી (આગાહી) વચ્ચેનો સંબંધ શું છે? અને 2) કયા ડિગ્રીમાં વ્યક્તિગત આગાહી કરનારાઓ તે સંબંધમાં ફાળો આપે છે?
- પગલાવાર બહુવિધ રીગ્રેસન એક સંપૂર્ણ અલગ પ્રશ્નનો જવાબ આપે છે. એક પગલાવાર રીગ્રેસન અલ્ગોરીધમ વિશ્લેષિત કરે છે કે પડોશીની પસંદગીની આગાહી કરવા માટે કયા આગાહીઓનો શ્રેષ્ઠ ઉપયોગ કરવામાં આવે છે - તેનો અર્થ એ છે કે પગલાવાર મોડલ એ આગાહી ચલોના મહત્વના ક્રમને મૂલ્યાંકન કરે છે અને તે પછી સંબંધિત સબસેટ પસંદ કરે છે. આ રીગ્રેસન સમસ્યા રીગ્રેસન સમીકરણને વિકસાવવા માટે "પગલાં" નો ઉપયોગ કરે છે. આ પ્રકારનાં રીગ્રેસનને જોતાં, તમામ આગાહીકર્તાઓ અંતિમ રીગ્રેસન સમીકરણમાં પણ દેખાશે નહીં.
- ક્રમશઃ રીગ્રેસન , પગલાની દિશામાં, અનુક્રમિક પ્રક્રિયા છે, પરંતુ પ્રિડેટર ચલો મોડેલમાં અગાઉથી નિર્ધારિત પૂર્વ-ઉલ્લેખિત ક્રમમાં દાખલ કરવામાં આવ્યા છે, એટલે કે અલ્ગોરિધમમાં ક્રમમાં નક્કી કરવા માટે એક સમીકરણોના બિલ્ટ-ઇન સેટનો સમાવેશ થતો નથી. આગાહી દાખલ કરો. આનો ઉપયોગ મોટાભાગે થાય છે જ્યારે રીગ્રેસન સમીકરણના વ્યકિતને ક્ષેત્રનું નિષ્ણાત જ્ઞાન હોય છે.
- સેટવ્યુ રીગ્રેસન એ પગલાવાર જેવું જ છે પણ વ્યક્તિગત ચલોને બદલે ચલોના સમૂહોનું વિશ્લેષણ કરે છે.