一時,業界對數據的價格知路暫息在定性層面,模型控制預測甚至可以大概敘是蕪淺的定性層面。群眾廣漠認為數據很有價格,但原形價格幾多?一旦涉及到定量領會,21年4月1日數據量化分析則從理論到實質,都干枯找尋與商榷——的確檢索不到數據價值接洽籌議的論文。若是敘麥卡特夫定律是互聯網企業等收集關連企業收場價格的理論基石,則數據接洽企業尚缺乏雷同的理論基石。模型控制預測
數據自在題目與數據價值題目是數據相閉工業繁盛的硬幣正反面:數據寧靜是數據價值的保證,數據價值是數據寧靜的條款。數據平寧若不能贏得有用擔保,時間序列預測模型則數據再有價值也無法贏得有效好處;看待數據價格若沒有共識,則無法發生界線家產,數據安靖做的再好也沒有沒有須要性。數據價值的量化明確接頭20
1) 針對數據自己價值:如果數占領n個有效表頭,預測分析法主要包括則數據價格與(2^n-1)成正比。好比,某數擁有姓名、性別、民族、年事……等n個有效表頭,則拿出n個有用表頭中的恣意1個可發生Cn1個場景,拿出n個表頭中任意2個可爆發Cn2個場景……拿出n個表頭中的全部n個可爆發Cnn個場景。即可構成場景的個數為Cn1+Cn2+Cn3+……+Cnn=2^n-1。時間序列預測模型
如某數占領姓名、性別、時間序列預測模型民族、年事……等10個有效表頭,可與收支境數據,預測分析法主要包括健康數據,住房數據,購物數據4個外部數據設立有用毗連。時間序列預測模型則數據己方最多可配置2^10-1=1023個場景,預測分析法主要包括預測分析法主要包括時間序列預測模型在團結規則1下,最多可修筑2^(10+4)-1=16383個場景,模型控制預測在糾合規則2下,最多可修立4*(2^10-1)=4092個場景。
由此可看到,數據的價格起首在于數據所有人方的價格掘客,模型控制預測數據自己價值與數據表頭個數的指數級成正比。時間序列預測模型數據建立有用的外部薈萃后,則數據價格遵循聯合規矩的差別,或與外部聯結數目成正比,或與外部連結數的指數級成正比。數據價值的量化明確接頭2021年4月1日數據量化分析。