Bác nào biết về stats, cứuuu em!

late
07-12-05, 02:25
Các bác, tình hình của em là đã dốt lại còn đua đòi, mấy hôm nay toàn hóng hớt chuyện buôn ma túy với lại chửa hoang ở TL nên bay giờ chết không kịp ngáp. Em phải nộp bài stats vào sáng thứ 5 mà hiện không biết làm thế nào.

Vấn đề là thế này:

Đề bài cho một cái regression model.
Sau khi run White test thì kết luận là nó bị heteroskedasticity (tức là residual bị depends vào variables).
Nó yêu cầu chỉnh bằng cách normalise size của dependent, tức là đem dependent chia cho 3 loại biến khác, thành ra 3 cột dependents mới, rồi run 3 cái regressions của 3 cột dependents này với variables cũ, thành ra 3 cái regression models mới, có R-squared, adjusted R-squared đàng hoàng (1).
Sau đó lại phải xem xem 3 models mới này có bị heteroskedasticity nữa không, lại bằng White test, kết luận đều là không, tất cả 3 đều homo hết. Nhưng trong 3 cái có 1 cái homo nhất, 1 cái homo nhì, và 1 cái homo bét, dựa vào F-statistics và p-value của White test. (2).

Bây giờ nó bắt em chọn the best model trong 3 cái model kể trên. Em không biết chọn thế nào, vì cái model có R-squared cao nhất (ở (1)) thì lại có p-value thấp nhất (ở (2)). Tức là cái model best fit về regression thì lại bị heteroskedasticity nhất. Vậy chọn dựa vào R-squared hay dựa vào mức độ heteroskedasticity

Em biết là em đang hỏi rất chã, nhưng quả thật là em không biết và em cuống quá rồi. Tất cả các câu hỏi sau đấy lại đều làm trên best model được chọn ở ngay đầu tiên này, nên nếu em chọn sai thì đi hết cả bài.

Các bác có lòng hảo tâm thương đến cả bọn tội phạm, bớt chút thời gian giúp em. Em xin nhận title chã nhất TL. Kính các bác.
Gaup
07-12-05, 03:20
Chia dependent cho 3 loại biến khác là ba loại biến gì? Normalize size kiểu gì mà lạ thế?

Có số không?

Anh thì nghĩ nếu đã không còn heteroskedasticity thì chọn cái nào có R2 lớn nhất là hợp lý - best fit.
late
07-12-05, 05:04
A bác Gấu em đây rồi. Đấy phải như bác mí gọi là từ thiện bác nhờ.

Em cũng nghĩ như bác. Nhưng em không biết có đúng hay không để còn làm tiếp, nên em phải hỏi. Bác bẩu thế nào em sẽ nhắm mắt đưa chân.

Tại vì khả năng trình bày của em hạn chế nên bác mới thấy nó lằng cbn nhằng. Bác cho em trình bày thêm.

Dependent = Petroleum consumption in the state (Pcon)
Variables = gasoline tax rate in the state (tax), and (tax^2) (trước đấy đã thử nonlinear nên thêm tax^2 vào)

"3 biến khác" của em là;
Reg = motor vehicle registrations in the state
UHM = urban highway miles
Pop = population in the state

6 cột này rất dài, nằm song song cạnh nhau, trong excel í, em không copy vào đây được

Nếu lấy dependent là Petroleum consumption in the state, thì sau khi run regression xong, nó bị heteroskedasticity, vì phần residual còn lại vẫn có quan hệ regression với tax và tax^2.
Nhưng nếu đem chia Pcon cho Reg, UHM hay Pop, thành 1 cột mới, em thấy nó gọi là WLS (weighted least squares method), và lấy cột mới này làm dependent rồi regression nó với tax và tax^2, thì không bị heteroskedasticity nữa.

Chuyện nó là như vậy. Như em trình bày ở trên, em băn khoăn không biết chọn cái model có R^2 cao nhất, nhưng lại có độ heteroskedasticity cũng cao nhất, thì có sao không, hay là chỉ cần kết luận không bị heteroskedasticity là được rồi.

Bác thử xem lại hộ em một lần nữa nhé. Sau lần này bác bẩu thế nào em sẽ liều thế ấy.

Xin cảm ơn và sẽ hậu tạ bác.
Gaup
07-12-05, 06:07
Regression làm bằng excel à em? Nếu dùng Stata thử reg pcon tax tax2, robust xem thế nào. Anh không biết cách làm mấy cái này trong excel.

Cái này có phải bài lấy trong quyển using econometrics của Studenmund không?
late
07-12-05, 06:21
Em không biết là bọn nó lấy ở đâu bác ạ.
Bọn em không dùng Stata, mà dùng phần mềm khác (StatTools). Em không biết cái robust bác nói là cái gì. Bác ơi nhanh nhanh lên em cuống lắm rồi mà bác thì cứ đủng đà đủng đỉnh.

(bác cứ viện dẫn sách này sách nọ mới cả dùng từ chuyên môn là em không biết đâu, bác nói ngôn ngữ phổ thông đi)
Gaup
07-12-05, 06:30
Giờ em copy regression result của ba cái em chạy sau lên đây anh xem cái đã.
late
07-12-05, 06:37
Đây đây file đây bác Gấu

http://s50.yousendit.com/d.aspx?id=1WM22C0RV5CW03FIH3EI0AKW9B

Ở trên em nhầm 1 tý. Variable chỉ là tax thôi, không có tax^2 đâu.
Lúc làm White test thì mới run regression của residual^2 với tax và tax^2 xem có bị linear không nhé.
Gaup
07-12-05, 07:06
Anh sẽ chọn cái pconpop on tax.

Cái này không phải là WLS gì cả.

Vừa thử nghịch cái.

. reg ppop tax

Source | SS df MS Number of obs = 50
-------------+------------------------------ F( 1, 48) = 9.14
Model | .027224664 1 .027224664 Prob > F = 0.0040
Residual | .143045754 48 .00298012 R-squared = 0.1599
-------------+------------------------------ Adj R-squared = 0.1424
Total | .170270418 49 .003474906 Root MSE = .05459

------------------------------------------------------------------------------
ppop | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
tax | -.0106656 .0035287 -3.02 0.004 -.0177606 -.0035706
_cons | .251062 .0364448 6.89 0.000 .1777848 .3243392
------------------------------------------------------------------------------

. estat hettest tax

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: tax

chi2(1) = 14.10
Prob > chi2 = 0.0002


. imtest, white

White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity

chi2(2) = 5.55
Prob > chi2 = 0.0624

Cameron & Trivedi's decomposition of IM-test

---------------------------------------------------
Source | chi2 df p
---------------------+-----------------------------
Heteroskedasticity | 5.55 2 0.0624
Skewness | 8.77 1 0.0031
Kurtosis | 3.74 1 0.0530
---------------------+-----------------------------
Total | 18.07 4 0.0012
---------------------------------------------------
late
07-12-05, 07:19
Đúng, em nghe bác. Em đã quyết như thế rồi. Làm xong xuôi rồi, mấy hôm nay lên TL cứ nghe các bác nói chuyện giết/không giết, có tội mà không có tội, nhân đạo mà dã tâm, v.v... đại khái là cứ sắc sắc không không làm cho em cũng tàu hỏa nhập ma tự nhiên lại nghĩ là có khi phải chọn theo heteroskedasticity, nên chắc phải làm lại hết cả assignment thì chắc em cũng đến treo cổ em lên cho xong.

Bác ơi, cái bác nghịch trên kia là bác run trong Stata à? bác giải thích thêm cho em đôi lời chứ em có biết Stata đâu, mà chữ bé thế hả bác. Với lại em cũng không hiểu rõ về WLS đâu, khi nào bác cãi nhau ở mấy topic kia, có thời gian rảnh bác giảng lại cho em.

Cảm ơn bác Gấu không già của em rất nhiều!
Gaup
07-12-05, 07:30
Hờ hờ, hôm nào weekend lên đây với anh anh nói cho :) . Giờ phải đi về kiếm gì ăn đã.
late
07-12-05, 07:43
Dạ vầng, em đã hứa là sẽ hậu tạ bác rồi mà lại. Chưa gì bác đã gợi ý mang lễ lạt đến rồi, lại còn kêu đói nữa mới chết. Bác em chỉ được cái thế là nhanh.
saint
07-12-05, 19:16
Không biết chú đã nộp bài chưa, nhưng có vẻ bài tập của late có nhiều vấn đề. Thôi để anh giảng lại từ căn bản cho chú.

Phương pháp chung cho mô hình hồi quy với phương sai thay đổi:
y=c+beta*x+resid
var(resid)=var(t)

1. Trường hợp chung:

Estimated beta=[{X' (omega^-1)*X}^-1]X'(omega^-1)y.

var(t)=sigma^2*w(t) or where sigma=const, omega^-1 là ma trận đường chéo với các phần tử đường chéo của ma trận là 1/w(t)

GLS estimators:
y/(w(t)^1/2)=c/(w(t)^1/2)+beta*x/(w(t)^1/2)+resid/(w(t)^1/2)

Estimators này gọi là WLS estimator

2. Trường hợp cụ thể
var(t)=sigma^2*z^2(t)
where sigma=const, omega^-1 là ma trận đường chéo với các phần tử đường chéo của ma trận là 1/z^2(t)

GLS estimators:
y/z(t)=c/z(t)+beta*x/z(t)+resid/z(t)

Trường hợp này giống bài của chú. Do đó anh nghĩ chú đã sai cơ bản khi không chia dependant biến (tax) cho các biến làm weight (reg, uhm, pop)

Quay lại lựa chọn model, tất nhiên lại phải xét trên chuẩn BLUE (Best linear unbiased estimator) cơ bản của regression model

Model sau khi không còn hetero từ White test sẽ trở nên reliable for significant test, muốn biết có best hay không chỉ có thể so sánh bởi R-squared.

Chú ý vào critical value 1%, 5% hay 10%. Ví dụ model của chú PCON/POP on tax obtained p-value for White test = 0.073 thì vẫn có thể reject H(0) of no - hetero at 10% level of significance như thường

Do vậy bài tập bắt chú phải biện luận, vd chọn level of sig =0.1 thì model PCON/REG on tax là tối ưu
Còn chọn level of sig=0.05 thì model PCON/POP on tax là tối ưu

Gaup góp ý dùng lệnh Robust để estimate cái White hetero consitent estimtor cho cái original regression, dùng cái này thì model đầu tuy vẫn còn hetero nhưng không còn underestimate true variance dẫn đến overestimate t-value cho test of significance nữa.


Sau đây là bài giải của anh đối với model của chú,

Equation 1
============

Method of estimation = Ordinary Least Squares


Dependent variable: PCON
Current sample: 1 to 49
Number of observations: 49

Mean of dep. var. = 611.653
Std. dev. of dep. var. = 682.490
Sum of squared residuals = .188110E+08
Variance of residuals = 400234.
Std. error of regression = 632.640
R-squared = .158647
Adjusted R-squared = .140746
LM het. test = 11.5751 [.001]
Durbin-Watson = 2.22093 [<.809]
White het. test = 15.8623 [.000]
Breusch-Pagan het. test = 1.38466 [.000]
Jarque-Bera test = 63.5020 [.000]
Ramsey's RESET2 = 6.37948 [.015]
F (zero slopes) = 8.86241 [.005]
Schwarz B.I.C. = 388.444
Log likelihood = -384.552

Estimated Standard
Variable Coefficient Error t-statistic P-value
C 1851.14 426.054 4.34485 [.000]
TAX -122.405 41.1172 -2.97698 [.005]


Equation 2
============

Method of estimation = Ordinary Least Squares


Dependent variable: PCON
Current sample: 1 to 49
Number of observations: 49

Mean of dep. var. = 611.653
Std. dev. of dep. var. = 682.490
Sum of squared residuals = .188110E+08
Variance of residuals = 400234.
Std. error of regression = 632.640
R-squared = .158647
Adjusted R-squared = .140746
LM het. test = 11.5751 [.001]
Durbin-Watson = 2.22093 [<.809]
White het. test = 15.8623 [.000]
Breusch-Pagan het. test = 1.38466 [.000]
Jarque-Bera test = 63.5020 [.000]
Ramsey's RESET2 = 6.37948 [.015]
F (zero slopes) = 8.86241 [.005]
Schwarz B.I.C. = 388.444
Log likelihood = -384.552

Estimated Standard
Variable Coefficient Error t-statistic P-value
C 1851.14 688.815 2.68743 [.010]
TAX -122.405 61.1827 -2.00065 [.051]
Standard Errors are heteroskedastic-consistent (HCTYPE=2).


Equation 3
============

Method of estimation = Ordinary Least Squares


Dependent variable: PCONPOP
Current sample: 1 to 49
Number of observations: 49

Mean of dep. var. = .141959
Std. dev. of dep. var. = .058644
Sum of squared residuals = .140019
Variance of residuals = .297913E-02
Std. error of regression = .054581
R-squared = .151811
Adjusted R-squared = .133764
LM het. test = 5.15954 [.023]
Durbin-Watson = 2.05160 [<.610]
White het. test = 5.27913 [.071]
Breusch-Pagan het. test = 37.7604 [.000]
Jarque-Bera test = 51.6662 [.000]
Ramsey's RESET2 = .490167 [.487]
F (zero slopes) = 8.41215 [.006]
Schwarz B.I.C. = -70.0962
Log likelihood = 73.9880

Estimated Standard
Variable Coefficient Error t-statistic P-value
C .246145 .036758 6.69635 [.000]
TAX -.010289 .354741E-02 -2.90037 [.006]


Equation 4
============

Method of estimation = Ordinary Least Squares


Dependent variable: PCONUHM
Current sample: 1 to 49
Number of observations: 49

Mean of dep. var. = 53.7048
Std. dev. of dep. var. = 25.3217
Sum of squared residuals = 28387.9
Variance of residuals = 603.997
Std. error of regression = 24.5764
R-squared = .077627
Adjusted R-squared = .058002
LM het. test = 3.68690 [.055]
Durbin-Watson = 1.88177 [<.377]
White het. test = 4.22273 [.121]
Breusch-Pagan het. test = .017829 [.000]
Jarque-Bera test = 39.1365 [.000]
Ramsey's RESET2 = .246441 [.622]
F (zero slopes) = 3.95550 [.053]
Schwarz B.I.C. = 229.286
Log likelihood = -225.394

Estimated Standard
Variable Coefficient Error t-statistic P-value
C 85.8731 16.5510 5.18838 [.000]
TAX -3.17677 1.59729 -1.98884 [.053]


Equation 5
============

Method of estimation = Ordinary Least Squares


Dependent variable: PCONREG
Current sample: 1 to 49
Number of observations: 49

Mean of dep. var. = .194963
Std. dev. of dep. var. = .079612
Sum of squared residuals = .261899
Variance of residuals = .557232E-02
Std. error of regression = .074648
R-squared = .139145
Adjusted R-squared = .120829
LM het. test = 4.23607 [.040]
Durbin-Watson = 1.93518 [<.450]
White het. test = 4.38251 [.112]
Breusch-Pagan het. test = 43.2890 [.000]
Jarque-Bera test = 106.680 [.000]
Ramsey's RESET2 = .085830 [.771]
F (zero slopes) = 7.59691 [.008]
Schwarz B.I.C. = -54.7548
Log likelihood = 58.6466

Estimated Standard
Variable Coefficient Error t-statistic P-value
C .330372 .050272 6.57170 [.000]
TAX -.013372 .485160E-02 -2.75625 [.008]


Equation 6
============

Method of estimation = Ordinary Least Squares


Dependent variable: PCONPOP
Current sample: 1 to 49
Number of observations: 49

Mean of dep. var. = .141959
Std. dev. of dep. var. = .058644
Sum of squared residuals = .140348
Variance of residuals = .298614E-02
Std. error of regression = .054646
R-squared = .149817
Adjusted R-squared = .131728
LM het. test = 3.46194 [.063]
Durbin-Watson = 1.83739 [<.319]
White het. test = 4.66099 [.097]
Breusch-Pagan het. test = 2.28380 [.000]
Jarque-Bera test = 63.3221 [.000]
Ramsey's RESET2 = .149374 [.701]
F (zero slopes) = 8.28221 [.006]
Schwarz B.I.C. = -70.0387
Log likelihood = 73.9305

Estimated Standard
Variable Coefficient Error t-statistic P-value
C .119689 .010992 10.8887 [.000]
TAXPOP 3.97248 1.38035 2.87788 [.006]


Equation 7
============

Method of estimation = Ordinary Least Squares


Dependent variable: PCONUHM
Current sample: 1 to 49
Number of observations: 49

Mean of dep. var. = 53.7048
Std. dev. of dep. var. = 25.3217
Sum of squared residuals = 23434.1
Variance of residuals = 498.597
Std. error of regression = 22.3293
R-squared = .238585
Adjusted R-squared = .222385
LM het. test = .669633 [.413]
Durbin-Watson = 1.79818 [<.272]
White het. test = 1.28895 [.525]
Breusch-Pagan het. test = 17.2577 [.000]
Jarque-Bera test = 127.975 [.000]
Ramsey's RESET2 = 2.81381 [.100]
F (zero slopes) = 14.7272 [.000]
Schwarz B.I.C. = 224.588
Log likelihood = -220.696

Estimated Standard
Variable Coefficient Error t-statistic P-value
C 43.8072 4.10210 10.6792 [.000]
TAXUHM 4.32274 1.12642 3.83760 [.000]


Equation 8
============

Method of estimation = Ordinary Least Squares


Dependent variable: PCONREG
Current sample: 1 to 49
Number of observations: 49

Mean of dep. var. = .194963
Std. dev. of dep. var. = .079612
Sum of squared residuals = .284351
Variance of residuals = .605002E-02
Std. error of regression = .077782
R-squared = .065346
Adjusted R-squared = .045460
LM het. test = 1.18692 [.276]
Durbin-Watson = 1.77375 [<.245]
White het. test = 1.56101 [.458]
Breusch-Pagan het. test = 12.1843 [.000]
Jarque-Bera test = 136.472 [.000]
Ramsey's RESET2 = .261568 [.611]
F (zero slopes) = 3.28601 [.076]
Schwarz B.I.C. = -52.7397
Log likelihood = 56.6315

Estimated Standard
Variable Coefficient Error t-statistic P-value
C .174851 .015703 11.1352 [.000]
TAXREG 2.70150 1.49029 1.81274 [.076]

*******************************************************************************
Quan Nhân
07-12-05, 20:20
Có 1 chuyện khá hay.

Cô giáo lớp 3B trả bài tập về nhà hôm trước. Cô khen:
- Bạn A hôm nay làm bài tốt, được điểm cao nhất lớp. Cô mời người cao điểm nhất lớp lên trước lớp nào. Kìa, A, em đi đâu đấy?
- Thưa cô, em sang lớp 5B để mời anh trai em ạ.

Ok?
Gaup
07-12-05, 22:30
Saint nói về đại thể là đúng rồi. Tuy nhiên sẽ máy móc một cách không cần thiết nếu phải chia cả tax cho mấy cái reg, uhm, pop kia. Thay vì estimate ảnh hưởng (loosely speaking) của thay đổi mức thuế lên tổng tiêu thụ xăng (coi như là xăng để đi xe đi) thì mình sẽ xem xét các mức bình quân, tức là xem cá nhân người tiêu dùng phản ứng thế nào với các thay đổi về thuế. Thế cho nên thực ra chỉ có hai cái pop và reg là có ý nghĩa thiết thực. Tổng tiêu thụ xăng chia cho số miles sẽ ra gas mileage, tức là tốn bao nhiêu xăng cho mỗi ngàn urban highway miles - mình chả quan tâm đến cái này làm gì. Nếu phải dùng đến uhm thì sẽ regress uhm hoặc uhm/pop trên tax để xem thuế tăng giảm thì người ta có giảm tăng số miles driven không. Lý do có heterosk. ở đây anh nghĩ có thể là do pcon vary widely trong khi tax chịu những policy constraints không thể tăng quá hay giảm quá một mức nhất định, phải plot cái residual của cái regression đầu thì mới biết được. Lấy bình quân pcon cho số dân hay số xe đăng ký sẽ giúp normalize cái variation trong pcon capturing the influence of individual choice and decision in the face of changes in tax rate.

Lựa chọn pcon/pop hơn là pcon/reg cũng có lợi hơn ở chỗ khi thuế tăng hay giảm thì những thay đổi trong hành vi tiêu dùng của cá nhân sẽ thay đổi theo gần như ngay lập tức. Hôm nay mà xăng tăng giá do thuế tăng thì anh có thể lựa chọn ngay tối nay cắt bớt việc lái xe ghẹo gái ngoài phố. Nhưng sẽ có một time lag nhất định trong quyết định của người ta ngừng không mua xe hơi nữa do thuế tăng làm giá xăng tăng --- more costly to drive. Sở hữu xe hơi có nhiều considerations khác hơn là chỉ có việc tốn bao nhiêu để lái nên lượng xe đăng ký không nhất thiết phản ánh chỉ hay toàn bộ quyết định và lựa chọn tiêu dùng của cá nhân khi có thay đổi về thuế.
KhổngMinhĐức
07-12-05, 22:59
Hê hê, em late sướng nhá, được 2 cao thủ Econometrics Saint với Gaup góp ý thế này thì bài perfect rồi.

Bác Saint nói về phần technical thế là đỉnh rồi. Cái bác góp ý em late ở đây là theo đúng phương pháp standard WLS thì phải weight cả 2 bên chứ không chỉ có 1 bên biến phụ thuộc.

Còn lý do tại sao chỉ weight một bên biến phụ thuộc thì như bác Gaup bạn em giải thích economic meaning rồi, rất rational.

Chúc em late được full mark :winkwink:
late
07-12-05, 23:13
Không biết chú đã nộp bài chưa, nhưng có vẻ bài tập của late có nhiều vấn đề.
Em chưa, còn 20 tiếng nữa.


y/z(t)=c/z(t)+beta*x/z(t)+resid/z(t)
Trường hợp này giống bài của chú. Do đó anh nghĩ chú đã sai cơ bản khi không chia dependant biến (tax) cho các biến làm weight (reg, uhm, pop).
Bác ơi em không biết có phải không. Cái bác giải thích cho em về WLS em hiểu là nếu dùng biến tax (bản thân biến của regression) để normalize size cơ, và khi đó sẽ là regression POP/tax = a + b/tax + new residual.

Nhưng biến tax ở đây của em lại là tax = tax rate/ per gallon of gasoline, chứ không phải tax rate nói chung đâu, ở trên em nói không rõ, xin lỗi các bác. Thế nên chắc vì vậy không được dùng để normalise size, vi đã được normalised rồi.

Ở đây chắc là do Pcon thì chưa normalise, mà biến thì lại là per gallon rồi, nên họ yêu cầu dùng thử các biến POP, UHM và REG để normalise Pcon xem thế nào. Nên em băn khoăn vụ chia tiếp tax per gallon cho POP/UHM/REG một lần nữa lắm. (Em vừa học được mấy tuần, không biết gì về stats bác ạ, common sense của em thấy thế, có gì không phải, bác bảo em).



Quay lại lựa chọn model, tất nhiên lại phải xét trên chuẩn BLUE (Best linear unbiased estimator) cơ bản của regression model. Model sau khi không còn hetero từ White test sẽ trở nên reliable for significant test, muốn biết có best hay không chỉ có thể so sánh bởi R-squared.
Vầng, cảm ơn bác.



Chú ý vào critical value 1%, 5% hay 10%. Ví dụ model của chú PCON/POP on tax obtained p-value for White test = 0.073 thì vẫn có thể reject H(0) of no - hetero at 10% level of significance như thường
Vầng lại đúng bác ạ. Em dùng 5%. Ở trên em quên không nói.



Sau đây là bài giải của anh đối với model của chú
Bác ơi em lại nhắc lại là em mới học và học rất dốt, bác với bác Gấu cứ cho em xem result của các bác em không đọc được đâu.
Em chỉ mới biết mỗi R2 và F statistics của White test.
Nếu bác đúng, là phải normalise cả biến tax, và nếu dựa vào R2 như bác và Gấu không già bảo em thì phải chọn model 7.

Pcon/UHM = a + bTAX/Uhm + new residual.
Mà model này cũng homo nhất.

Phải không hả bác?
Buồn nhỉ. Em học cả chiều. Thế là đêm nay không ngủ à.

Cảm ơn các bác nhé.
Hao_Beo
07-12-05, 23:31
Thưa các bác tiền bối,

Em rất kính nể các bác học thức uyên thâm. Thực đáng ngưỡng mộ.

Nhân đây em xin các bác giúp em ra lời giải đáp cho bài toán đố vui mà thằng em út em nhờ giải (Toán lớp 9, Mà em cóc hiểu là đề ra có đúng nữa hay không, vì với hết cả tài hèn sức mọn của thằng sinh viên đại học, em tịt.)

Đề bài:
Có ba anh Tây và ba anh mọi ăn thịt người, cần đi qua một con sông. Họ chỉ kiếm được 1 cái thuyền nhỏ, mỗi lần chỉ chở được hai người qua sông. Nếu số mọi nhiều hơn số các anh Tây thì đám mọi sẽ ăn thịt họ.
Hỏi có cách nào để họ sang được sông mà vẫn bảo tòan được đủ quân số.

Mong có bác nào rảnh rang gảy vài phím chỉ bảo giúp em, em xin đội ơn trước.

.
late
07-12-05, 23:35
Bác Hào Béo hỏi thật hay hỏi đùa đấy. Zồi ôi ruột em đang rối như tơ vò đấy không đùa với bác được đâu. Em chả thấy buồn cười gì cả.
Bác gì Xanh Xanh đâu rồi, bác đang ở múi giờ nào thế, đi ngủ rồi à?
Gaup
07-12-05, 23:46
Tax rate đánh trên một gallon hay 1000 gallon cũng thế thôi, 9% chứ còn bao nhiêu nữa. Chẳng lẽ 9%/gallon và 9000%/1000 gallons à.

Em cuống quá rồi.
late
08-12-05, 00:20
Bác bác bác Gấu chỉ được cái mắng là nhanh. Vầng đúng là cuống thật. Có thêm cái cho bác mua vui hôm nay còn gì.

Ý em là nếu tax rate tăng, thì ngoài việc consumption của 1 người tăng, số người dùng xăng cũng tăng. Thế nên nếu so tổng consumption với tax rate thì nó bị 2 lần tăng, nên chắc vì thế bị heterosk.
Bây giờ chỉ lấy regression của consumption trên đầu người thôi, thì nó không heterosk nữa.

Còn nếu chia cả tax rate cho population thì cái biến mới tax/pop này không có ý nghĩa về mặt kinh tế (hoặc có nghĩa gì đó nhưng mà dân thường như em không hiểu)

Cái đoạn bác Gấu giải thích về mặt kinh tế là quá đúng rồi. Em đang chép.

Nhưng em không biết gì về stats regression với mấy cái công thức tính residual của các bác. Em muốn hỏi các bác là nếu không chia biến POP/UHM/REG thì có đúng phương pháp làm giảm heterosk của residual về mặt công thức toán học không?
saint
08-12-05, 00:24
hihi, bác gaup lại vào trêu em nó dồi. Em cứ bình tĩnh. Kết hợp economic explaination của gaup với lại technical result của anh em mình là ok

Mấy tên các ông đầu hói khác em không cần quan tâm. Anh quote lại những số liệu cần cho bài của em, thực ra result từ different software ko khác nhau là mấy, em cứ yên tâm dùng excel hay soft em đang sử dụng

Equation 3
============
Dependent variable: PCONPOP

R-squared = .151811
Adjusted R-squared = .133764

White het. test = 5.27913 [.071]
Estimated Standard
Variable Coefficient Error t-statistic P-value
C .246145 .036758 6.69635 [.000]
TAX -.010289 .354741E-02 -2.90037 [.006]


Equation 5
============

Method of estimation = Ordinary Least Squares
Dependent variable: PCONREG


R-squared = .139145
Adjusted R-squared = .120829

White het. test = 4.38251 [.112]

Estimated Standard
Variable Coefficient Error t-statistic P-value
C .330372 .050272 6.57170 [.000]
TAX -.013372 .485160E-02 -2.75625 [.008]


Nhìn vào regression result thấy rất economically rational là tax rate tỉ lệ nghịch với mức sử dụng xăng/đầu người hay mức sử dụng xăng /xe. Ví dụ đơn giản là thuế tăng, giá xăng tăng, dân Việt Nam thay vì đi xe thì đi xe buýt. Còn cái nào rational hơn thì theo anh có lẽ xăng/xe more rational, cái nào sử dụng rộng rãi hơn lại là xăng/đầu người. Cái này cũng như trong kinh tế tính GDPper capita thì ai cũng biết, nhưng để more efficient thì các nhà kinh tế lại sử dụng GDP per worker.

Giải thích về technical, thì như anh đã nói, em dựa vào critial value, cái này thì tùy em, em là decision maker, tùy vào purpose, nếu em thích xăngperxe hay hơn thì chọn p=0.1, còn nếu em thích xăngpercapita hơn thì em chọn p=0.5. Kết hợp statistical result với economic explanation nữa, cái này em có thể xem lời giải thích của gaup bạn anh và anh ở trên.

Cái WLS của anh giải thích ở trên như bác Đức nói, là dùng để tính WLS estimator, cái này nói chung là phức tạp vì không phải lúc nào ta cũng biết omega.

Cái WLS của em không phải là WLS estimator mà chỉ dùng để normalize size, làm cho biến tổng xăng/xe... varies around averaged mean. Vì thế không cần thiết phải weight tax/xe ....nữa

Hì hì, chắc em đã tự tìm cho mình lời giải rồi chứ! :)
late
08-12-05, 00:36
Em vừa hỏi ở trên, thì đã thấy bác trả lời ngay rồi.



Hì hì, chắc em đã tự tìm cho mình lời giải rồi chứ! :)

Vâng em hiểu rồi các bác ạ.
Cảm ơn Gấu và Saint rất nhiều. :)
ownalm
08-12-05, 09:41
Ơ, em xin lỗi lạc đề cái, cho em hỏi có phải bác Saint bên TL kia không ạ? mà nếu phải thì em hỏi luôn cái là bao giờ bên kia nó "xong" hở bác ( sửa xong hoặc xong hẳn ấy )
Xin lỗi bạn late và các bác lần nữa.
HaMinh
08-12-05, 10:12
Các bác, tình hình của em là đã dốt lại còn đua đòi, mấy hôm nay toàn hóng hớt chuyện buôn ma túy với lại chửa hoang ở TL nên bay giờ chết không kịp ngáp. Em phải nộp bài stats vào sáng thứ 5 mà hiện không biết làm thế nào.

Vấn đề là thế này:

Đề bài cho một cái regression model.
Sau khi run White test thì kết luận là nó bị heteroskedasticity (tức là residual bị depends vào variables).
Nó yêu cầu chỉnh bằng cách normalise size của dependent, tức là đem dependent chia cho 3 loại biến khác, thành ra 3 cột dependents mới, rồi run 3 cái regressions của 3 cột dependents này với variables cũ, thành ra 3 cái regression models mới, có R-squared, adjusted R-squared đàng hoàng (1).
Sau đó lại phải xem xem 3 models mới này có bị heteroskedasticity nữa không, lại bằng White test, kết luận đều là không, tất cả 3 đều homo hết. Nhưng trong 3 cái có 1 cái homo nhất, 1 cái homo nhì, và 1 cái homo bét, dựa vào F-statistics và p-value của White test. (2).

Bây giờ nó bắt em chọn the best model trong 3 cái model kể trên. Em không biết chọn thế nào, vì cái model có R-squared cao nhất (ở (1)) thì lại có p-value thấp nhất (ở (2)). Tức là cái model best fit về regression thì lại bị heteroskedasticity nhất. Vậy chọn dựa vào R-squared hay dựa vào mức độ heteroskedasticity

Em biết là em đang hỏi rất chã, nhưng quả thật là em không biết và em cuống quá rồi. Tất cả các câu hỏi sau đấy lại đều làm trên best model được chọn ở ngay đầu tiên này, nên nếu em chọn sai thì đi hết cả bài.

Các bác có lòng hảo tâm thương đến cả bọn tội phạm, bớt chút thời gian giúp em. Em xin nhận title chã nhất TL. Kính các bác.

tình hình là trình em chỉ elementary nên muốn nói leo cũng ko được :mad:
late
08-12-05, 10:20
tình hình là trình em chỉ elementary nên muốn nói leo cũng ko được :mad:
Vầng trình em thế nào em bẩm báo các bác ngay để các bác có thuốc rồi còn gì. Em leo lên hỏi xong rồi leo xuống rồi.
Bác Hà Minh nào sao tự nhiên nhảy vào quát mắng gì đớiii? Em không hiểu?

@bác ownalm: không sao bác, bác ghé chơi là vui rồi.
giangthu
08-12-05, 11:33
Đề bài cho một cái regression model.
Sau khi run White test thì kết luận là nó bị heteroskedasticity (tức là residual bị depends vào variables).
Nó yêu cầu chỉnh bằng cách normalise size của dependent, tức là đem dependent chia cho 3 loại biến khác, thành ra 3 cột dependents mới, rồi run 3 cái regressions của 3 cột dependents này với variables cũ, thành ra 3 cái regression models mới, có R-squared, adjusted R-squared đàng hoàng (1).
Sau đó lại phải xem xem 3 models mới này có bị heteroskedasticity nữa không, lại bằng White test, kết luận đều là không, tất cả 3 đều homo hết. Nhưng trong 3 cái có 1 cái homo nhất, 1 cái homo nhì, và 1 cái homo bét, dựa vào F-statistics và p-value của White test. (2).

Anh Gấu (hàng xịn) nói đúng đấy, chia cột tức là có chút logic nhưng mà vẽ rắn thêm chân. Em cứ tính z-score, xong đẩy vô Minitab, nó sẽ biểu hiện Matrix Plot cho thấy sự tương quan. Sample size for proportions của em N>25 cho nên, cứ dựa vào các công thức CIT mà tính P và biện luận. Cơ hồ chị thấy Saint Béo làm ì xèo như khoe hàng về Hypothesis Testing. Chị nghĩ đâu có nghiêm trọng như vậy. Bài mà nó cho data sống sượng chắc là không phải dự đoán dự điếc gì đâu mà chỉ dùng z-score đặng tìm tương qua là chủ yếu. Lâu ngày lụt nghề, nhưng mà lúc xưa chị toàn xài Minitab không đấy.

Hạ long bị sập, tự nhiên thấy Saint đi vô đây dạy học. Bồi hồi quá!
Sất
08-12-05, 11:49
ối giời, tập trung đông đủ nhở. Mà sao dạo này thấy giangthu tăm tích mất dạng lâu lắm rồi, hình như cứ Sất đi đâu thì giangthu mới vào TL thì phải.
giangthu
08-12-05, 11:54
Loại data cứ tính z-score để normalize là được 50% điểm. Dùng bõ plot để loại trừ mấy cái outliner. Chỉ có TAX là không tương quan còn các thứ khác đều tương quan. Xong cộng trừ nhân chia mấy hàng z-score (tùy em) truy nó về một cột duy nhất. Dùng z-score chỉ làm 30 phút là xong. Phản biện được liền. Còn các thứ khác như Saint chỉ là không phải thuộc loại bài kiểu này. Rãnh thì đưa nguyên đề lên đây. Mấy cái viết tắt đó phải nói rõ ra là gì thì người ta mới giúp được cho chứ!
giangthu
08-12-05, 11:58
ối giời, tập trung đông đủ nhở. Mà sao dạo này thấy giangthu tăm tích mất dạng lâu lắm rồi, hình như cứ Sất đi đâu thì giangthu mới vào TL thì phải.

Sất thương nhớ! Từ cuối tháng 8 có thề 3 tháng mới quay lại đặng coi thế thái nhân tình. Bây giờ Saint cũng vào đây rồi. Coi chừng chúng ta lại bị hất cẳng.
HaMinh
08-12-05, 12:43
Vầng trình em thế nào em bẩm báo các bác ngay để các bác có thuốc rồi còn gì. Em leo lên hỏi xong rồi leo xuống rồi.
Bác Hà Minh nào sao tự nhiên nhảy vào quát mắng gì đớiii? Em không hiểu?

@bác ownalm: không sao bác, bác ghé chơi là vui rồi.

bác late hiểu lầm em rồi, ý em là em mới học stats nên trình còn còm quá ko nói leo theo được chứ có ko có ý gì khác cả :)
late
11-12-05, 04:08
Hê hê, em late sướng nhá, được 2 cao thủ Econometrics Saint với Gaup góp ý thế này thì bài perfect rồi.

Chúc em late được full mark :winkwink:

Trả bài rồi. Đúng thế bác ạ.

Cảm ơn các bác.

Icon: Ôm hôn!!!!
postef
12-12-05, 00:00
Đọc cái topic này xong, anh đâm hoảng. Thề là từ đầu đến cuối anh hiểu được một chữ anh chết. Từ nhỏ đến lớn, có mỗi lúc tính tiền là anh dùng đến công thức toán thôi.
late
12-12-05, 00:21
Đọc cái topic này xong, anh đâm hoảng. Thề là từ đầu đến cuối anh hiểu được một chữ anh chết. Từ nhỏ đến lớn, có mỗi lúc tính tiền là anh dùng đến công thức toán thôi.

Thế là nhất rồi bác, hoảng gì.
Mà bác này, cái người mà em ôm hôn, lại không biết tính tiền đâu đớiiii!
:)
Sất
14-12-05, 13:31
Giang thu à, không sao đâu. Thực ra Sên phò tuy hói hiếc ra thế nhưng mà cũng đáng yêu phết.