[CZ] První zadání od Slevomat.cz

Prvních 5 otázek do "Proof of Concept":


---------- Forwarded message ----------
From: Tomáš Čupr <tom@slevomat.cz>
Date: 2012-04-02 13:29 GMT+02:00
Subject: Reporty Slevomatu
To: Petr Šimeček <petr@keboola.com>

Zdravím, 

jak jsem slíbil, tak posílám návrh pár jednoduchých reportů, kterými bych naši spolupráci začal.

- Gross sales a net sales v daném měsíci. Výkon oproti targetu a historie za poslední 3 měsíce. Deal se počítá do daného měsíce pokud v něm začal (tj. transakce může proběhnout 3.4., ale pokud deal začal 31.3. tak se počítá do března)

- Average net revenue per subscriber po mesicich. 

- Average net revenue per coupon sold

- Cumulative customers as % of cumulative subscribers

- Average basket value a srovnani s prumernou cenou kuponu (nikoliv transakce, ale v ramci nabidky - tj restaurace za 300 a hotel za 1500 davaji prumer 900 Kč bez ohledu na počet prodejů). Cílem je zjistit, jaký vliv má nabídka na basket value. 

Jak jste asi pochopili, tak tez tuzeb je mnohem vic, ale pojdme se od toho odrazit :-) Klidně mi jeden nebo dva škrtněte.

Díky,

Tom

Moje odpovědi (poptávka po datech):

---------- Forwarded message ----------
From: Petr Simecek <petr@keboola.com>
Date: 2012-04-02 20:43 GMT+02:00
Subject: Re: Reporty Slevomatu
To: Tomáš Čupr <tom@slevomat.cz>


Dobrý večer,

určitě bysme z poslaných výkopů nic nevyhazovali a realizovali to společně (dost se to prolíná). Data pro první výkop je nejlepší dostat asi jednorázově, jako export z DB. Není asi nutné mít všechno, ale základní vazby je nutné dodržet. Věk klienta nebo druh platby určitě není mandatorní.

Mám jeden dotaz: 

  • Jak vnímáte svoje "net revenue"? Je to objem prodaných kuponů v čase, mínus reklamace/storna ?

Mimo sepsané požadavky na data mě napadá, že by bylo prima mít brzo po vykopnutí reportingu i toto:
  • data o supportu - kdy po vás jaké ID_zákazníka něco chce?
  • data o reklamacích - kdy jaké ID_zákazníka aplikuje storno/reklamaci na ID_kuponu (=risc management?)

Vámi sepsané požadavky jsem očísloval (jsou tučné) a připojil k nim požadavek na strukturu dat.


(1) Gross sales a net sales v daném měsíci. Výkon oproti targetu a historie za poslední 3 měsíce. Deal se počítá do daného měsíce pokud v něm začal (tj. transakce může proběhnout 3.4., ale pokud deal začal 31.3. tak se počítá do března)
  • potřebujeme cíle (období od-do, cíl, pro koho platí (např. target pro cestování nebo sales region))
  • potřebujeme transakce (datum a čas transakce, ID_nabídky, ID_kuponu, ID_zakaznika, cenu transakce)
  • potřebujeme informace o stornech, reklamacích, případně jiné položky pro spočítání net sales (datum vratky, ID_vracene_transakce, typ (storno, reklamace,..)

ID_nabídky by mělo obsahovat:
  • ID_nabídky
  • ID_Obchodníka, který nabídku domluvil
  • ID_Dodavatele služby/předmětu
    • Lokalita Dodavatele (+ relevantní informace vhodné pro segmentaci: např. IČO a informace jestli s ním jsou problémy)
  • Lokalita čerpání nabídky (pokud je relevantní)
  • Kategorie nabídky (a případné sub-kategorie, včetně třeba očekávané cílovky <= libovolná segmentační kriteria)
  • Datum od kdy do kdy je nabízena
  • Kolik minimálních objednávek nutných pro aktivaci
  • Byla nabídka na titulce nebo bokem?
  • Avizovaná standarní cena nabídky
  • Limit na osobu (pokud se aplikuje)
  • datum expirace nabídky (kolik mám času na využití nabídky, než kupón propadne)

ID_kuponu by mělo obsahovat:
  • ID_kuponu
  • Datum transakce
  • Druh platby (hotově, kartou,…)
  • ID_nabídky
  • ID_zákazníka
  • koupeno jako dárek?
  • datum uplatnění kuponu

ID_zákazníka by mělo obsahovat:
  • ID_zakaznika
  • Kontaktní údaje (Jméno, email, atd.) k ničemu nepotřebujeme -> předpokládám, že budeme pracovat s ID jako prvkem pro "dekomponování" informací o koho jde
  • Pohlaví
  • věk
  • město nebo alespoň okres
  • datum první registrace (je každý zákazník i subscriber?) -> pro cohort reporty
  • máte nějaká další segmentační data? 

(2) Average net revenue per subscriber po mesicich. 
  • Měli bysme umět vyrobit z podkladů pro (1)

(3) Average net revenue per coupon sold
  • Měli bysme umět vyrobit z podkladů pro (1)

(4) Cumulative customers as % of cumulative subscribers
  • Potřebujeme u ID_zákazníka mít i subscribery, kteří ještě nic nekoupili -> pak nechť máme bokem všechny subscribery v podobné struktuře jako zákazníky (ID, pohlaví/město/věk (víme-li), preference nabídek (pokud víme) a datum první registrace). Z toho uděláme running totaly subscriberů a zákazníků.

(5) Average basket value a srovnani s prumernou cenou kuponu (nikoliv transakce, ale v ramci nabidky - tj restaurace za 300 a hotel za 1500 davaji prumer 900 Kč bez ohledu na počet prodejů). Cílem je zjistit, jaký vliv má nabídka na basket value. 
  • Z ID_nabídky umíme sestavit co kdy bylo na webu nabízeno - průměrná cena kuponu v konkrétní den.
  • Z informací nutných pro (1) umíme sestavit hodnotu košíku (a libovolně ji navíc "řezat" podle věku zákazníka, aj.).


Pokud by bylo pro vás komplikované data vyexportovat, můžeme do toho skočit víc po hlavě = poslal bych k vám našeho programátora, aby našel společnou řeč s vaším programátorem. Varianty jsou pak vyrobení "view" ve vaší DB a exportování dat na denní bázi k nám na server (nějaký SSL REST put, XML-RPC, SOAP - celkem jsme připraveni na všechno, všetně pravidelného fetchování dat od vás). V momentě pravidelného aktualizování je nutné do dat přidat snapshotování, protože vám budou zákazníci stárnout, stěhovat se, vdávat, aj. - pak je dobré u historických dat udržet "původní" informace. Stejně tak je nutné například hlídat do jakého týmu/regionu patří obchodník, kterého budete přeřazovat/přejmenovávat/...

Mrzí mě, že je moje odpověď tak dlouhá - snažil jsem se to osekat, ale … :)

díky,
Petr

Comments