आरएल में जीएलएम भविष्यवाणी

मैंने डेटा सेट को ट्रेन और टेस्ट में निम्नानुसार दिखाया:

splitdata<-split(sb[1:nrow(sb),], sample(rep(1:2, as.integer(nrow(sb)/2))))
test<-splitdata[[1]]
train<-rbind(splitdata[[2]])

एसबी मूल डेटा सेट का नाम है, इसलिए यह 50/50 ट्रेन और परीक्षण है।

फिर मैंने प्रशिक्षण सेट का उपयोग करके एक ग्लैम लगाया।

fitglm<-  glm(num_claims~year+vt+va+public+pri_bil+persist+penalty_pts+num_veh+num_drivers+married+gender+driver_age+credit+col_ded+car_den, family=poisson, train)

अब मैं अगले 10 अवलोकनों का कहना है कि इस ग्लैम का उपयोग करके भविष्यवाणी करना चाहता हूं।

मुझे पूर्वानुमान() में newdata निर्दिष्ट करने में परेशानी है,

मैंने कोशिश की:

pred<-predict(fitglm,newdata=data.frame(train),type="response", se.fit=T)

इससे कई भविष्यवाणियां मिलेंगी जो प्रशिक्षण सेट में नमूने की संख्या के बराबर होती हैं।

और आखिरकार, आत्मविश्वास अंतराल के साथ इन भविष्यवाणियों को कैसे साजिश करना है?

सहायता के लिए धनयवाद

0
एक पुनरुत्पादित उदाहरण tinyurl.com/reproducible-000 को दृढ़ता से प्राथमिकता दी जाएगी। साथ ही, आप कहते हैं कि आपने क्या प्रयास किया है, लेकिन आप यह नहीं कहते कि क्या गलत हुआ: क्या आपको कोई त्रुटि मिली (यदि हां, तो यह क्या था)? क्या परिणाम गलत थे/जो आपने अपेक्षित नहीं थे (यदि हां, तो आप कैसे जानते हैं)?
जोड़ा लेखक Ben Bolker, स्रोत
+ आप test train डेटा पर अनुमानित predict का मतलब है? और "अगले 10 अवलोकन" से आपका क्या मतलब है?
जोड़ा लेखक Stephen Henderson, स्रोत

1 उत्तर

यदि आप पूछ रहे हैं कि टेस्ट सेट में अगले 10 पर पूर्वानुमान कैसे बनाएं, तो:

pred10<-predict(fitglm,newdata=data.frame(test)[1:10, ], type="response", se.fit=T) 
0
जोड़ा