Update:
"
Hôm nay là một ngày đẹp trời."
Đúng vậy, thời tiết Hà Nội hai ngày nay thật là đẹp, trước khi bước vào mùa hè bỏng cháy. Trời đẹp đến nghiêng người, thế mà tôi lại ngồi nhà để code, chẹp. Thật có lỗi với bản thân và thời tiết.
Đối với một input: "Hôm nay là một ngày đẹp trời", gần như đây chỉ là một diễn giải rất đơn giản và tổng quát.
- Đẹp như thế nào?
- Nắng như thế nào?
- Gió ra làm sao?
- Mưa không?
- Cái gì như nào?
- Cái gì ra sao?
- vân vân, vân mây...
Nếu một input đơn giản ở đầu vào, tiếp tục được khai thác mở rộng, chi tiết hơn, thì cái hiểu về một ngày đẹp trời sẽ rõ ràng hơn. Và từ sự rõ ràng này, chúng ta sẽ có những quyết định tốt hơn.
Đối với bài toán trading mà nói, khi bạn đã giao dịch được một số lượng lệnh nào đó, trong lịch sử giao dịch có chứa lệnh thắng, lệnh thua. Vậy tại mỗi thời điểm vào lệnh, nếu mình hiểu được các đặc tính của market tại thời điểm đó, rất có thể mình cũng sẽ có một cú trade ổn hơn.
Câu hỏi đặt ra hở đây là:
Làm sao để hiểu bối cảnh này? Và làm sao để diễn giải/mô tả được nó cho một cái máy?
Cá nhân tôi có cách nhìn khá đơn giản, hoặc tôi luôn cố gắng để đơn giản hóa mọi vấn đề, vì thế, đối với bài toán trading này, cách nghĩ của tôi cũng như vậy.
Giá và sự di chuyển của giá, tôi không muốn dự đoán nó, vì đó là việc vô nghĩa nhất trên đời, không thể làm được.
Cái tôi muốn làm, là xác định những gì đã xảy ra, nó đã xảy ra trong bối cảnh như thế nào. Để lần sau, nếu một bối cảnh tương tự xảy ra, tôi cũng sẽ đưa ra một quyết định được cho là tốt nhất cho bối cảnh đó, theo kinh nghiệm đã nghiên cứu.
Tôi nhìn vấn đề rất đơn giản. Các yếu tố chính ảnh hưởng đến giá gồm có:
- Timing (thời điểm)
- Volume (khố lượng)
- Value (giá trị biến động)
- Range (biên độ dao động)
- Speed (tốc độ dao động)
Để có thể khai thác được các thông tin này, tôi đã liệt kê và tập hợp một danh sách các features(thuộc tính dữ liệu) liên quan đến chúng. Tổng cộng tôi đã tập hợp được 108 features tất cả:
6 năm lăn lộn với trading, 108 thuộc tính này là tất cả kiến thức và trí tuệ của tôi chuyển hóa vào bài toán này. Đây là tất cả những gì tôi hiểu về trading, và đang cố gắng tìm cách để chuyển giao nó sang AI.
Sẽ không có chuyện tôi sử dụng tất cả 108 thuộc tính này trong một model, bởi vì như vậy chắc chắn sẽ gây ra vấn đề nghiêm trọng. Nó được gọi tên là Overfit trong AI. Overfit là tình trạng dữ liệu quá nhiều và quá chi tiết, dẫn đến quá trình training xa rời với thực tế, training thì tốt mà thực tế thì như hạch. Bởi vì trong thực tế, chẳng có cái gì sẽ diễn ra đúng như khi nghiên cứu cả, luôn có sai số.
Tôi sẽ lần lượt thử nghiệm với từng nhóm thuộc tính, đưa cái này vào, rút cái kia ra. Quá trình thử nghiệm phải nói là dài như cách mạng. Nhưng không sao, tôi đã thò một chân vào game rồi, không thể dừng lại nữa, phải đi tới cùng thôi. Các bạn cùng chia sẻ, thảo luận và chờ đợi cùng tôi nhé.
Chúc bạn một ngày vui khỏe và tốt lành.