Statistik-Wahnsinn II

  • Es ist nun endlich so weit. Nach einer längeren Pause geht das einflussreichste und revolutionärste Rekordbau-Projekt in 1404 in die zweite Runde. Viel ist seitdem passiert. Dieses Mal habe ich ein Ziel, nämlich die Rekordbau-Theorie grundlegend zu erarbeiten und umzusetzen, und hoffentlich auch den langen Atem, der bitter nötig ist, um das Ganze durchzuziehen und neue Impulse zu setzen.

    Dass das hier ein neuer Thread ist, hat mehrere Gründe. Einerseits will ich die Dinge anders angehen. Der erste Statistik-Wahnsinn genügt da nicht mehr ganz meinen Qualitätsansprüchen. Außerdem ist er über die Zeit ganz schön lang geworden und das tut der Übersichtlichkeit sicher keinen Gefallen. Zuletzt will ich auch inhaltlich aufräumen und den aktuellen Stand der Dinge nicht auf eine Stufe mit dem, was ich vor einigen Jahren geschrieben habe, stellen. Die II im Titel kann man also auch als 2.0 verstehen. Außerdem will ich dieses Mal dem Titel gerecht werden und die Statistiken nicht nur für mich behalten. Der erste Statistik-Wahnsinn wird hiergegen wie das Distributivgesetz aussehen.

    Passend zu diesem Neuanfang habe ich ebenfalls meinen alten Rekordbauversuch, der ursprünglich eh nicht als solcher gedacht war, eingestellt und fange von vorn an. Das hat ebenfalls seine Gründe. Insbesondere wird dieser Thread parallel zu meinem Rekordbau gepflegt, sodass ich das Gelernte gleich in der Praxis erproben kann.

    Genug der Vorreden. Derzeit sind Abhandlungen zu folgenden Themenkomplexen angedacht:

    • Kartenwahl
    • Bevölkerungsstufen
    • Städtebau
    • Wirtschaft und Produktion
    • Items
    • Logistik und Schiffe
    • Passivhandel

    Einige davon werden aufgrund ihrer Komplexität mehrteilig sein. Dazu kommen ein paar one-off-Themen, die eher populärwissenschaftlicher Natur sind. Ich bin auch offen für Themenvorschläge. Und ja, anders als gewisse Marder habe ich nicht vor, hier vorschnell abzudanken.

    Kommen wir zur Methodik und der Struktur von dem, was folgen soll. Die genannte Themenwahl beschränkt sich zwar zu einem Großteil auf den Rekordbau, aber innerhalb dieser Themen möchte ich vor allem ein gutes Gesamtverständnis erlangen. Das muss also nicht auf den Rekordbau gemünzt sein. Trotzdem muss ich natürlich festlegen, was ich wissen will. Zu jedem Thema stelle ich daher ein paar Fragen, die ich dann versuche, zufriedenstellend zu beantworten. Da dies oft nicht ohne Fundierung möglich ist, werde ich sie in einfachere Fragen aufteilen. Ist das so oft geschehen, dass ich die einfachsten Fragen beantworten kann, setze ich diese Erkenntnisse zusammen, um damit die ursprünglichen Fragen zu beantworten. Diese Vorgehensweise dürfte im ersten Thema ersichtlich werden. Ich denke, damit bleibt das Ganze übersichtlich und animiert dazu, die Antworten zu finden, die man sucht, anstatt sich mit Halbwissen abspeisen zu lassen.

    So einfach wird das aber nicht. Ich tu zwar, was ich kann, aber hier wird nicht alles objektiv und wertungsfrei sein. Ein paar Anmerkungen werde ich mir sowieso nicht verkneifen können. Mein Ziel ist es auch nicht, die höchste Bevölkerungszahl oder ähnliche Superlative zu ermitteln. Es ist immer ein Abwägen zwischen dem, was man will, und dem, was man kann. Auch das dürfte beim ersten Thema ersichtlich werden.

    Und zuletzt noch eine Ankündigung. Unter https://discord.gg/z4Pn5bQnxD kann man der 1404-Expertengruppe beitreten. Das ist ein Discord-Server unter meiner Leitung, der, so ist es zumindest gedacht, komplementär zu diesem Thread existiert. Dort wird es neben ausufernden Diskussionen, für die Foren meiner Meinung nach nicht der ideale Ort sind, diese Abhandlungen als PDF geben und einige Erkenntnisse werden vielleicht dort zuerst bekanntgemacht. Aber ich mach mir da keine falschen Hoffnungen. Spätestens beim zweiten Contest vom Commander dürfte klar geworden sein, dass der Rekordbau in 1404 den ewigen Winter angetreten hat.

    Das soll es vorerst gewesen sein. Demnächst kommt das erste Thema, nämlich die Kartenwahl.

  • Ich denke, ich habe nun genug Spannung aufgebaut. Machen wir also weiter.

    Kartenwahl

    Aller Anfang ist bekanntlich schwer. Ich persönlich habe hiervor keine Bemühungen unternommen, eine gute Karte zu finden. Zu hoffen, dass der Seed keinen allzu großen Unterschied macht, ist zwar verständlich und statistisch nicht abwegig, finde ich, aber beim Rekordbau hat diese Denkweise meiner Ansicht nach nichts zu suchen. Da muss man eben durch.

    Die Frage ist jedenfalls naheliegend: Was ist die beste Karte? Um diese Frage beantworten zu können, reicht es theoretisch, da es nur endlich viele Karten gibt, eine Liste aller Karten inkl. relevanter Daten zu haben und für jeweils zwei Karten entscheiden zu können, welche die bessere ist. Das liegt im Wesentlichen daran, dass das Maximum assoziativ ist, d. h., max{max{a,b},c} = max{a,max{b,c}}. So werden wir aber nicht weit kommen, da es sehr viele Karten gibt und die Bewertung nicht immer einfach ist. Wann ist eine Karte denn besser als eine andere? An sich hängt das nicht vom Bauplatz oder ähnlichen Werten ab, denn im Rekordbau gewinnt der, der am meisten Einwohner ansiedelt. Eine Karte ist also besser als eine andere, wenn man auf ihr mehr Einwohner ansiedeln kann als auf der anderen. Und da ist das Problem. Es ist praktisch unmöglich, das für eine einzige Karte rauszufinden, da es viel zu viele Entscheidungen gibt, die man treffen kann. Hier komme ich also nicht drum herum, einige -- hoffentlich unschädliche -- vereinfachende Annahmen zu treffen, denn wenn ich diese Frage vollständig beantworten könnte, wäre der Rekordbau sofort entschiedene Sache. Folgende Annahmen halte ich für nahezu unproblematisch:

    • Den Bauplatz betreffend ist nur die Gesamtzahl an bebaubaren Kästchen relevant. Diese Sichtweise blendet die Form der Inseln natürlich aus. Das ist insofern problematisch, als Norias und öffentliche Gebäude platzeffizienter sind, wenn die Inseln an den Rändern kreisförmig sind. Oft kann man zwar ausweichen und dort andere Gebäude platzieren, aber maximal viele Adlige kriegt man nur, wenn man alles zumindest zeitweise besiedelt.
    • Fruchtbarkeiten sind nicht von Belang. Die vorhandenen und variablen Fruchtbarkeiten sollten so viel Spielraum bieten, dass hier keine Karte wesentlich besser als eine andere ist.

    In der Betrachtung fehlen noch Ressourcenvorkommen und Flussbauplätze, aber dazu kommen wir später. Da man hier mit bloßer Theorie meines Wissens nicht weit kommen wird, soll es erstmal um den anderen Teil der Kartenwahl gehen, nämlich Daten von Inselwelten, wie sie in der Praxis auftauchen.

    Inseldaten

    Eins der großen Probleme bei der Kartenwahl ist die Datenbeschaffung und -auswertung. Die Beschaffung wiederum besteht meines Erachtens aus zwei Teilen: Dem Messen von Inseln und dem Erzeugen von Inselwelten. Fangen wir mit Ersterem an. Da Fruchtbarkeiten und Ressourcenvorkommen auf den gleichen Inseln variieren können, sind hier für mich nur zwei Daten interessant, nämlich die Größe der Inseln und die Anzahl der Flussbauplätze. (Vulkaninseln bilden hier wie auch im Folgenden eine Ausnahme, aber dazu kommen wir später.) Letztere ist einfach zu ermitteln. Die Größe einer Insel ist da schon etwas schwerer zu fassen. Einerseits ist es Definitionssache, was nun als Bauplatz zählen soll und was nicht. Bspw. sind einige Kästchen für Straßen, aber nicht für Gebäude bebaubar. Das für mich deutlich größere Problem ist aber die Fummelarbeit, die ein naives Vermessen mit sich bringt. Das sage ich nicht nur aus Faulheit, sondern auch wegen der Fehleranfälligkeit. Glücklicherweise gibt Anno einem gleich das passende Werkzeug zur Hand, um das halbwegs effizient zu machen. Der venezianische Platz und seine Geschwister sind quasi Straßen, die jede Rechtecksform annehmen können. Damit kann man also ein Gebiet auswählen und anhand der Kosten schnell die Anzahl der Kästchen berechnen. Da die Kosten nur für bebaubare Kästchen anfallen, ist das (fast) genau das, was man braucht. Es kann nun durchaus sein, dass da auch zweifelhafte Kästchen mit bei sind, die zu nichts zu gebrauchen sind, aber das sollte die Ausnahme sein. Außerdem scheint da etwas sehr ineffizient berechnet zu werden, denn die Framerate geht bei großen Rechtecken schnell in die Brüche. Ich habe die Inseln also in relativ kleine Rechtecke aufgeteilt, die Kosten der Straßen und Plätze aufgeschrieben und damit die Gesamtgröße angenähert. Mit etwas Übung habe ich damit eine kleine Insel in 2 Minuten und eine große Insel in 10 Minuten vermessen können. Bei 125 Inseln trotzdem kein Pappenstiel. Da ich auch andere Einstellungen als die offensichtlichen (Venedig, Korsaren, riesige Inselwelt, große und einfache Inseln, viele Fruchtbarkeiten und Ressourcen) ausprobieren will, habe ich alle Inseln vermessen, anstatt mich auf die relevanten zu beschränken. Im Folgenden werde ich getrennt alle Inseln und danach alle relevanten betrachten.

    Inselanzahlen

    Die Inseldaten gibt es als Textdatei zum Download. Dort stehen Namen, Flussbauplätze und Größen drin. An sich ist das Thema damit erledigt und für den Rekordbau stellen sich mir hier keine Fragen, aber das Gesamtverständnis lässt dann doch zu wünschen übrig. Gucken wir uns das also genauer an. Inseln werden intern in Nord- und Südinseln eingeteilt, die jeweils klein, mittel oder groß sein können. So viele gibt es davon, ausgenommen der fünf Vulkaninseln:

    LMSSumme
    N30 + 422 + 11572
    S11 + 418 + 11448
    Summe494229120

    Die rechten Zahlen vom Plus repräsentieren die Inseln, die durch das Addon dazugekommen sind. Wir sehen also, dass es deutlich mehr Nord- als Südinseln gibt. Bei Nordinseln dominieren die großen Inseln, bei Südinseln die mittleren. Woran das liegt, kann ich nicht genau sagen, aber es deckt sich mit der Dominanz des Okzidents gegenüber dem Orient, denn die meisten Bevölkerungsstufen und Betriebe gibt es im Okzident. Daher ist es schon verständlich, dass es mehr und größere Nordinseln gibt.

    Jetzt beschränken wir uns auf die Inseln, die bei den offensichtlichen Einstellungen auftreten können.

    LMSSumme
    N1171129
    S59923
    Summe16162052

    Weniger als die Hälfte der Inseln ist für uns also interessant. Hier liegen natürlich wieder die Nordinseln vorn, allerdings kann man das von großen Inseln nun nicht mehr behaupten. Stattdessen haben die kleinen Inseln überraschenderweise aufgeholt. Aber das ist gar nicht mal so schlecht, denke ich, denn da die großen Inseln die wichtigsten sind, unterscheiden sich die Inselwelten damit prinzipiell weniger.

    Inselgrößen

    Reden wir jetzt über die Inselgrößen. Da es verhältnismäßig wenig Inseln gibt, ist die Verteilung der Inselgrößen meiner Meinung nach nicht sinnvoll. Stattdessen sind hier die Inseln der Größe nach sortiert. Die blauen Punkte stehen für Nordinseln, die roten für Südinseln. Die Vulkaninseln sind bei den mittleren Inseln mit eingetragen und schwarz markiert. Die x-Achse ist hier nur zur Nummerierung da, weswegen die Inseltypen (Nord, Süd, Vulkan), deren Anzahlen kleiner sind, mehr oder weniger regelmäßig nach rechts gestreckt wurden. Links sind alle Inseln des jeweiligen Typs, rechts die, die bei offensichtlichen Einstellungen auftauchen können.

    Ich schließe daraus Folgendes für die linken Diagramme bzw. alle Inseln:

    • Alle Inselgrößen variieren stark. Grob ist die größte Insel eines Typs dreimal so groß wie die kleinste. Bei Vulkaninseln und mittleren Südinseln ist der Unterschied sogar ca. das Fünffache.
    • Bei großen Inseln unterscheiden sich Nord- und Südinseln nicht maßgeblich bis auf die Pfannkucheninsel, die auch die zweitgrößte Insel locker in die Tasche steckt.
    • Bei mittleren Inseln sind Südinseln klar im Vorteil. Das deckt sich damit, dass es mehr mittlere Südinseln als große Südinseln gibt.
    • Bei kleinen Inseln bilden die Südinseln beide Extreme, also die kleinsten und größten kleinen Inseln sind Südinseln.

    Und nun zu den rechten Diagrammen.

    • Generell kann man sagen, dass die kleinsten Inseln nun nicht mehr auftauchen und die größten erhalten bleiben. Ein paar Ausnahmen gibt es aber. Z. B. wird N_M15 vermisst, die mit 8373 Kästchen und 6 Flussbauplätzen schon etwas zu bieten hat.
    • Bei den großen Inseln fallen viele unterdurchschnittlich große Inseln weg.
    • Die mittleren Südinseln haben einige gute Kandidaten verloren und sind dadurch nun in etwa gleichauf mit mittleren Nordinseln.
    • Die Vulkaninseln bleiben alle erhalten, was bei den beiden kleinsten nicht gerade eine gute Nachricht ist.
    • Bei den kleinen Inseln hat sich nicht viel verändert.
  • Flussbauplätze

    Es bleiben noch die Flussbauplätze. Folgendermaßen ist die Aufteilung nach der Anzahl der Flussbauplätze:

    0234567Summe
    Summe N33161677272
    Summe S291773 148
    Summe L18161155349
    Summe M26 2752 42
    Summe S18155 29
    Vulkan4 1 5
    Summe66213241073

    Aufgelistet sind die Anzahlen der Inseln, die jeweils eine bestimmte Anzahl an Flussbauplätzen haben. Das ist aufgeteilt in Nord- und Südinseln, darunter in große, mittlere und kleine Inseln.

    Auch hier gibt es nun meine Einschätzungen.

    • Nordinseln sind deutlich besser aufgestellt, was Flussbauplätze angeht. Sowohl die relative Anzahl der Inseln, die mindestens einen Flussbauplatz haben, sowie die durchschnittliche Anzahl an Flussbauplätzen auf denen, die mindestens einen haben, sind klar höher.
    • Die Inseln mit den meisten Flussbauplätzen sind groß, wobei immerhin zwei mittlere Inseln sechs Flussbauplätze haben.
    • Mittlere Inseln mit Flussbauplätzen schneiden zwar nicht schlecht ab, aber davon gibt es eher wenige.
    • Kleine Inseln stehen klar am schwächsten da.
    • In etwa die Hälfte aller Inseln hat keine Flussbauplätze. Da wird die Varianz bei verschiedenen Seeds sicher groß ausfallen.

    Und hier für die relevanten Inseln.

    0234567Summe
    Summe N10 2523129
    Summe S101353 123
    Summe L6 1412216
    Summe M8 1241 16
    Summe S12134 20
    Vulkan4 1 5
    Summe301511532

    Dazu denke ich Folgendes:

    • Überproportional viele Inseln (vor allem Süd-Inseln) ohne Flussbauplätze fallen weg. Ohne die Vulkane wäre das sogar noch eindeutiger.
    • Bei den Nordinseln sieht das nicht ganz so rosig aus. Außerdem ist dort die starke Mittelschicht mit 4 oder 5 Flussbauplätzen deutlich kleiner. Auch eine der beiden Inseln mit 7 Flussbauplätzen musste gehen.
    • Das Verhältnis von Inseln ohne Flussbauplätze zur Gesamtzahl ist bei großen Inseln fast gleich geblieben. Aber auch hier fallen einige der besten Inseln weg.
    • Die mittleren Inseln stehen dank der Süd-Dominanz besser da als zuvor.
    • Bei kleinen Inseln hat sich wieder nicht viel geändert.

    Das soll es vorerst gewesen sein. Ich wünsche frohe Weihnachten und ein besinnliches Fest.

  • Der Inselweltengenerator

    Hier gibt es sicher Einiges zu entdecken. Wie der Generator genau funktioniert, werden wir ohne Quellcode wohl nicht rausfinden, aber das müssen wir auch nicht. Jedenfalls stellen sich mir hier folgende Fragen:

    • Welche Einstellungen beeinflussen die Karte und welche nicht?
    • Wie sehr unterscheiden sich Bauplatz, Flussbauplätze und Ressourcen mit verschiedenen Einstellungen?
    • Und natürlich: Welche Einstellungen sind für den Rekordbau optimal?

    Die erste Frage ist relativ schnell geklärt. Folgende Beobachtungen habe ich gemacht:

    • Alles auf den Seiten 4 und 5 der Kartenerstellung im Spiel beeinflusst die Karte kein bisschen.
    • Ebenso sind Computergegner und die Stärke der Korsaren, solange letztere vorhanden sind, irrelevant.
    • Mit Venedig kommen einige neue Inseln hinzu.
    • Das Vorhandensein eines Vulkans hat Einfluss auf mehrere Inseln. Ich hab eine Inselwelt mit Vulkan mit einer ohne Vulkan und ansonsten mit gleichen Einstellungen verglichen und es waren 6 Inseln anders, davon eine Südinsel.
    • Die Wahl des Vulkans ist unabhängig von der Inselschwierigkeit. Außerdem kriegt man die ersten beiden Vulkaninseln nur bei riesigen Karten und großen Inseln.
    • Die Korsaren ersetzen praktisch eine kleine Südinsel, wenn sie angeschaltet sind. Deswegen gibt es dann geringfügig weniger Süd-Ressourcen. Allerdings beeinflussen Korsaren wie auch der Vulkan die Wahl anderer Inseln.
    • Neutrale Kräfte beeinflussen die Fruchtbarkeiten und Ressourcen minimal, aber nicht die Wahl und Positionen der Inseln. Anscheinend können sich nur Gewürze, Seide und Indigo ändern. Bei den Ressourcen bleibt die Anzahl der Vorkommen meines Wissens gleich, aber der initiale Bestand variiert.
    • Fruchtbarkeiten beeinflussen die Inseln ebenfalls nicht, aber dafür die Ressourcen, sowohl in Anzahl und Bestand. Das scheint keinem einfachen Schema zu folgen. Ich hab ein paar Tests gemacht und dort haben sich Stein, Sole, Eisen und Bärenhöhlen geändert. Die Summe aller Anzahlen an Ressourcenvorkommen scheint allerdings konstant zu sein.
    • Rohstoffe ändern sich mit der entsprechenden Einstellung nicht in ihrer Anzahl, aber dafür in ihrem Bestand und ihrer Kapazität. Fruchtbarkeiten werden dadurch auch nicht beeinflusst.
    • Neutrale Kräfte und Fruchtbarkeiten ändern außerdem die Riffe ab.

    Basierend auf diesen Beobachtungen sind nun folgende Einstellungen zu variieren:

    • Kartengröße
    • Inselgröße
    • Inselschwierigkeit
    • Fruchtbarkeiten
    • Korsaren
    • Grundspiel / Venedig
    • Vulkan

    Nun, zumindest teilweise. Ich werde sicher nicht jede Kombination, von denen es 4*3*3*3*2*2*3/2 = 648 gibt, lang und breit durchprobieren, sondern mich auf die beschränken, die ich interessant finde. Fangen wir mit der Inselgröße und -schwierigkeit an. Da diese Einstellungen die Hauptfaktoren bei dem Pool an verfügbaren Inseln spielen, behandele ich sie in einem Rutsch. Folgendermaßen verhalten sich Maximum und Durchschnitt von Bauplatz und Flussbauplätzen, wenn man diese Einstellungen variiert und sonst offensichtliche Einstellungen benutzt, beschränkt auf Seeds 1 bis 100.

    EinfachNormalSchwierig
    Klein213194 | 199117189565 | 174678164452 | 148376
    Mittel246880 | 228886207892 | 193648172669 | 158959
    Groß261691 | 239793222524 | 204769190720 | 173186


    EinfachNormalSchwierig
    Klein87 | 7485 | 6667 | 54
    Mittel98 | 7986 | 7168 | 55
    Groß94 | 7891 | 7174 | 58

    Unten links sind also die offensichtlichen Einstellungen. Beim Bauplatz sind diese offenbar am besten. Paradoxerweise hat die Inselschwierigkeit einen größeren Einfluss auf den Bauplatz als die Inselgröße. Bei den Flussbauplätzen ist das noch eindeutiger, da dort die Größe nur einen geringen Unterschied ausmacht. Außerdem übertrumpfen einfache, mittelgroße Inseln die offensichtlichen Einstellungen knapp.

    Es bleiben noch ein paar andere Vergleiche übrig. Die passen aber immerhin in eine Tabelle.

    BauplatzFlussbauplätze
    Offensichtl. Einst.261691 | 23979394 | 78
    Große Karte198768 | 17493481 | 59
    Grundspiel255028 | 23762187 | 72
    Korsaren aus270487 | 24885095 | 80

    Meine Überlegungen:

    • Der Unterschied zwischen großen und riesigen Inselwelten ist klar erkennbar, aber nicht allzu groß.
    • Überraschenderweise ist der Unterschied zwischen Grundspiel und Addon zumindest im Durchschnitt trotz Pfannkucheninsel kaum bemerkbar. Das wird natürlich auch an Garibaldis Abwesenheit liegen. Es macht aber den Anschein, dass es im Addon mehr Ausreißer gibt als im Grundspiel.
    • Korsaren reduzieren den Bauplatz um deutlich mehr als die Insel, die sie ersetzen. Offenbar kann man hier mit 9k Kästchen Unterschied rechnen, aber der Schein trügt. Auch bei gleichen Seeds schwankt der Unterschied stark. Bei besagten Seeds ist der kleinste Unterschied 213 und der größte 17519.

    Eine Sache habe ich unterschlagen, nämlich die Ressourcen. Da habe ich nicht viel zu zu sagen, also verweise ich auf den Anhang der PDF, in dem eine größere Tabelle zu finden ist, die die verschiedenen Einstellungen durchgeht.

    Und nun zur letzten Frage. Die offensichtlichen Einstellungen haben sich größtenteils bewährt. Zwei Punkte sind aber noch offen.

    • Was ich bis jetzt verschwiegen habe, ist, dass man den Vulkan in WorldEditor² nicht ausschalten kann. Die Karten manuell auszuwerten, halte ich für eine Sisyphusarbeit, die ich nicht gewillt bin, zu erledigen. Auch semiautomatisch, z. B. mit dem Erstellen von Screenshots im Spiel, um die Minimap per Bilderkennung auszuwerten, halte ich das für kaum effizient. Die Entscheidungen, ob das Addon verwendet wird und der Vulkan eingeschaltet ist, fallen für mich also zusammen. Da aber der Bauplatz im Addon offenbar größer ist und es mehr Ausreißer zu geben scheint, denke ich, dass die Entscheidung auch unabhängig von Garibaldi und Vulkan auf das Addon fallen sollte. Offenbar ist der Vulkan mit den meisten variablen Ressourcen dabei zu bevorzugen.
    • Bei den Korsaren ist das nicht so leicht zu sagen. Wenn der Unterschied im Bauplatz bei gleichem Seed nur gering ist, kann man Korsaren sicher anschalten. Streng genommen wäre eine vollständige Messung allerdings angebracht. Hier kann ich leider nur mutmaßen. Bei 17519 Kästchen an zusätzlichem Bauplatz passen ca. 35k Einwohner sowie nötige Betriebe mehr auf die Inselwelt, wenn man sie denn versorgen kann. Hassan verkauft so viel Golderz, wie ca. 30 Goldminen produzieren, was für ca. 110k Adlige reicht, weswegen er ein wichtiger Handelspartner ist. Um die Frage, ob Korsaren angeschaltet werden sollen, zu beantworten, sind anscheinend tiefgreifende Kenntnisse in Wirtschaft erforderlich. Vorerst kann ich hier also leider keine Antwort darauf geben. Da ich für die Messungen allerdings eine Entscheidung treffen musste, habe ich mich dafür entschieden, Korsaren anzuschalten.

    Technische Probleme

    Das hier ist nur ein kurzer Abschnitt über die Probleme, die ich bei der Datenerhebung angetroffen habe. Einige davon waren offensichtlich, andere haben sich erst bei der Auswertung ergeben. Bei einer sechsstelligen Anzahl an externen Funktionsaufrufen kann schon mal etwas schiefgehen.

    • Nach ca. 200 Kartengenerierungen wird WorldEditor² langsamer. Da ich einfach einen Timer habe runterzählen lassen, bevor die nächste Aktion ausgeführt wird, hat das nicht lang geklappt. Ich habe das Programm also neu starten lassen. Leider kann die Startzeit variieren, sodass auch das nicht reibungslos geklappt hat.
    • Die Bibliotheken, die mutmaßlich das Betriebssystem ansprechen, funktionieren zwar meistens, aber nicht immer. Wenn da eine Exception geworfen wird, hat mein Programm einfach aufgehört. Komischerweise hat sich die Häufigkeit dieser Vorfälle trotz Neustarts des PCs mit der Zeit erhöht. Waren es davor gern mal über 1000 ausgewertete Karten, so konnte ich später bestenfalls ein paar Hundert erwarten. Das musste ich dann beheben, wonach ich pro Tag ca. 2500 Karten auswerten konnte.
    • Ein paar Datensätze waren schlussendlich doch fehlerhaft. Zum Beispiel hat bei ca. 300 Karten jeweils eine Insel gefehlt.
    • Die Screenshots, die ich von den Ressourcen und Fruchtbarkeiten gemacht habe, waren fast immer richtig. Zweimal war das Bild allerdings falsch.
    • Und zuletzt ist mir aufgefallen, dass die Inselnamen manchmal falsch geschrieben waren. Statt N_Volcano stand da dann N_VolcAnO. Das kann ich mir wirklich nicht erklären.

    Damit sind nun die Weichen gestellt, um viele Karten zu erzeugen und Daten zu sammeln. Das habe ich aber schon erledigt. Die Ergebnisse davon gibt es im nächsten Jahr. Ich wünsche einen guten Rutsch.

  • Analyse der Inselwelten

    Nach der monatelangen Vorbereitung ist es nun endlich Zeit, die Inselwelten, die Anno so erzeugt, unter die Lupe zu nehmen.
    Die Daten, die hier analysiert werden und die es zum Download gibt, enthalten alle Seeds von 1 bis 99999 bei offensichtlichen Einstellungen.
    Offenbar kann man hier kreativ werden und viele verschiedene Untersuchungen anstellen. Deswegen werden mir sicher Muster und Erkenntnisse entgehen, da ich nicht an alles denke. Ich halte die Frage also simpel: Wie sehr unterscheiden sich die berechneten Inselwelten in puncto Bauplatz, Flussbauplätze, Ressourcen und Inseln?

    Extremwerte

    Fangen wir mit den besten (und schlechtesten) Karten bzgl. einzelner Kategorien an. Diese sind wie folgt:

    KategorieMinimumMaximumHäufigkeit
    Bauplatz20013827328434
    Flussbauplätze481053
    Stein55741
    Quarz22273497
    Sole13472
    Kohle212547
    Kupfer22262438
    Eisen33671
    Gold101211
    Perlen9112958
    Bärenhöhlen1427335

    Die Häufigkeit ist die Anzahl der Karten, die den Maximalwert vorweisen. Bei Bauplatz sind das die Karten mit >= 270000 Kästchen.

    Wir sehen also, dass man bei einigen Kategorien deutlich gieriger sein darf als bei anderen. Wer möglichst viel Eisen haben will, kann keine gute Karte erwarten, da man ohne Wahlmöglichkeit wahrscheinlich aufgeschmissen ist.

    Außerdem ist der Unterschied in den Bauplätzen meines Erachtens gigantisch. Auf die Pfannkucheninsel mit ihren 22k Kästchen kriegt man ca. 70k Adlige. Spätestens hier dürfte klar sein, dass ausführliche Überlegungen zur Kartenwahl im Rekordbau trotz großer Hürden unerlässlich sind.

    Ressourcen

    Das Maximum ist natürlich hoch gegriffen. Gucken wir uns also als Nächstes die Verteilungen der einzelnen Kategorien an. Bei denen mit nur wenig Varianz dürfte das in Tabellenform übersichtlicher sein.

    21222324252627
    Quarz 25133004393032547164743497
    Kohle397340004428941308147
    Kupfer 8471860962054160512438
    101112
    Gold192818070711
    91011
    Perlen14098829432958

    In der PDF sind Streu-Diagramme der anderen Werte. Offenbar sind Bauplatz, Flussbauplätze, Sole und Eisen normalverteilt, während Stein und Bärenhöhlen aus der Reihe tanzen.

    Nun kann man sich noch fragen, wie ressourcenreich eine Inselwelt insgesamt ist, und alles in einen Topf werfen. Dazu habe ich einfach die Summe aller Ressourcen (ohne Steine) pro Inselwelt gebildet. Das Minimum davon ist 183 und das Maximum ist 218. Letzteres wird von drei Seeds erreicht, nämlich:

    SeedBauplatzFlussQuarzSoleKohleKupferEisenGoldPerlenBärenhöhlenVariabel
    170922671558327332425551110276
    483022668008927402525481110266
    960892576398127322426561110266

    Im Anhang ist ein Bild, das die Anzahlen aller Inselwelten nach dieser Anzahl darstellt. Trotz Normalverteilung spielen alle drei im oberen Mittelfeld mit, was den Bauplatz angeht. Auch bei Quarz, Kohle, Kupfer und Bärenhöhlen sind diese Seeds ganze vorne mit dabei. Alle drei haben zudem 67 Steinvorkommen, was nicht gerade wenig ist. Andere Werte sind hingegen eher durchschnittlich. Man kann halt nicht alles haben.

    Inseln

    Hier kann man sich sicher Einiges einfallen lassen, was man untersuchen möchte. Welche Inseln treten wie oft auf? Welche ist am häufigsten vertreten? Wie oft kommen Inseln mehrfach auf einer Inselwelt vor? Leider kann man solche Informationen meines Wissens kaum sinnvoll zeichnen, weswegen es hier nur Tabellen gibt.

    Folgendermaßen ist die Gruppierung nach Häufigkeit aller besiedelbaren Inseln. Doppelte werden dabei nur einfach gezählt.

    HäufigkeitInseln
    1-25000N_L01 S_M09 S_M10 S_M15 N_Volcano01-5
    25001-50000N_L07 N_L17 N_S04 N_S05 N_S07 N_S08 N_S10 N_S11 N_S14 N_S15 S_M14 S_M16 S_M01a S_S01 S_S04 S_S09 S_S14
    50001-75000N_L03 N_L05 N_L06 N_L08 N_L23 N_L25 N_L01a N_L03a N_M02 N_M03 N_M04 N_M06 N_M07 N_M09 N_M10 N_S02 N_S03 N_S06 S_M01 S_M08 S_M13 S_S02 S_S03 S_S08 S_S10 S_S12
    75001-99999N_L09 S_L02 S_L04 S_L08 S_L11 S_L04a

    Der Großteil der Inseln ist also im Bereich 50001-75000. Seltene Inseln gibt es kaum.

    Die Vulkaninseln sowie die seltensten und häufigsten Inseln gibt es so oft:

    InselHäufigkeit
    N_Volcano0120001
    N_Volcano0219997
    N_Volcano0319995
    N_Volcano0420001
    N_Volcano0520005
    InselHäufigkeit
    N_L016
    S_L0295917
    S_L0495967
    S_L0895849
    S_L1193095

    Warum N_L01 derart selten ist, kann ich nicht sagen. Das Spiel wird wohl seine Gründe haben, die nur in Ausnahmefällen zu benutzen.

    Vulkane sind mit erstaunlicher Genauigkeit fast exakt gleichverteilt. Wer nun denkt, dass man daher ohne große Einschränkungen einen der beiden Vulkane mit mehr als 6 variablen Ressourcenvorkommen wählen kann, den muss ich enttäuschen. In den 34 größten Inselwelten mit mindestens 270000 Kästchen kommen diese beiden Vulkane kein einziges Mal vor. Die größte Inselwelt mit N_Volcano01 ist nur 267130 Kästchen groß, die mit N_Volcano02 265410. Das dürfte daran liegen, dass die variablen Ressourcen die einzigen sind, die an konkrete Inseln gebunden sind. Denn die Inseln wiederum beeinflussen den Bauplatz. Damit sind variable Ressourcenvorkommen statistisch abhängig vom Bauplatz.

    Kommen wir zu den Mehrfach-Inseln. Auf 8875 Karten ist mindestens eine Insel mehr als einmal zu finden. Auf 140 Karten passiert das gleich (exakt) zweimal und auf 6 sogar dreimal. Die Dopplungen insgesamt verhalten sich wie folgt:

    InselDopplungenInselDopplungen
    N_L037N_S03492
    N_L078N_S06511
    N_L096S_L021819
    N_L254S_L041765
    N_M02141S_L081797
    N_M043S_L111777
    N_M063S_M017
    N_M07140S_M083
    N_S02538S_M136

    Es können also nur Inseln aus dem Grundspiel mehrfach auftreten. Wenn das passiert, ist es meistens eine große Südinsel. In der Tat sind diese vier Inseln auch alle, die überhaupt auftreten können (bis auf S_L04a). Scheint so, als wollte das Spiel mehr große Südinseln platzieren, als es hat.

    Auf 118 von besagten 140 Karten mit genau zwei Dopplungen ist mindestens eine der doppelten Inseln eine kleine Insel. Auf 44 sind es sogar beide. Auf 2 sind beide doppelten Inseln groß, nämlich N_L03, S_L02 und N_L09, S_L04.

    Es bleiben noch die 6 Karten mit drei Dopplungen. Dort sieht es so aus:

    N_S02 (dreifach), S_L11
    N_S02, N_S03, S_L04
    N_S03, N_S06, S_L11
    N_S02, N_S06, S_L11
    N_S02, N_S06, S_L04
    N_S02, N_S06, S_L04

    Das entspricht meiner Ansicht nach auch den Erwartungen. Und ja, Inseln können auch dreimal auftreten.

    Eine Kleinigkeit bin ich noch angegangen. In der Tat sind alle 99999 Insellisten verschieden. Es gibt kein Paar von verschiedenen Seeds, die die exakt gleichen Inseln hervorbringen.

    Flussbauplätze

    Zuvor hab ich die Anzahl der Inseln ohne Flussbauplätze erwähnt. Das war nicht nur eine Spielerei, sondern hat auch spürbare Auswirkungen auf die Wirtschaft, da davon abhängt, wie effektiv man seine Items einsetzen kann. Konkret sieht das folgendermaßen aus:

    1112131415161718192021222324
    334297175461791437022876243501762288222957653766
    49484952565964677377828995100
    5159667276798487949598103105105

    Also bei 3 Inselwelten haben exakt 11 Inseln Flussbauplätze. Das Minimum an Flussbauplätzen von diesen 3 Inselwelten ist 49, das Maximum 51. Das ist in der Abbildung im Anhang nochmal veranschaulicht.

    Das ist leider keine allzu gute Nachricht. Wenn ich z. B. 90 Flussbauplätze haben will, sind die Items bei höchstens 11 Inseln - der Vulkan sei vernachlässigt - frei wählbar. Bei 18 Nicht-Fluss-Waren, die man boosten möchte, ergeben sich da also 7 Konflikte, bei denen zu entscheiden ist, was Priorität hat. Wer sich also nicht mit ca. 50 Flussbauplätzen begnügen kann, wird sich da etwas einfallen lassen müssen. Darauf komme ich bei der Bewertung zurück.

  • Bewertung der Inselwelten

    Nach all diesen Vorbereitungen kommen wir zum wohl wichtigsten Schritt, nämlich dem Finden guter Seeds.

    Flussbauplätze

    Wie ich erwähnt habe, ist eine Annahme, die ich treffe, dass nur der Gesamtbauplatz relevant ist und nicht die Wahl der Inseln. Bei Flussbauplätzen werde ich aber nicht alles über einen Kamm scheren. Für mich ist hier nicht die Gesamtzahl der Flussbauplätze entscheidend, sondern eine gewichtete Anzahl, die den optimalen Nutzen annähert. Das Problem mit der Gesamtzahl ist schnell geklärt. Wenn eine Insel viele Flussbauplätze hat, ist man eher dazu geneigt, Flussbetriebe zu boosten. Bei wenigen lohnt sich das nicht so sehr. Man muss sich also entscheiden, welche Inseln Flussbetriebe boosten sollen und welche nicht. Es gibt ca. 18 Betriebe exklusive Flussbetriebe, die Verbrauchsgüter erzeugen. Man kann allerdings von ca. 18 Inseln mit Flussbauplätzen ausgehen. Bei einigen Inseln wird man also einen Kompromiss finden müssen, da aller Voraussicht nach nicht alle Betriebe dreifach geboostet werden können. Die Größe der Inseln spielt dabei auch eine Rolle, da große Inseln eher für Farmkomplexe geeignet sind, aber das sollte nicht problematisch sein. Es gibt nur drei Farmtypen, die eine Fruchtbarkeit benötigen und sich boosten lassen. Da dürften sich also ein paar große Inseln mit wenigen oder gar keinen Flussbauplätzen finden lassen, auf denen man jene Farmen bauen kann.

    Ich bewerte das folgendermaßen. Seien a_1 <= ... <= a_n die sortierten Anzahlen der Flussbauplätze. Dabei ist n = 30 die Inselanzahl. Die ersten paar Zahlen sind also 0. Sei d die Anzahl der verschiedenen Waren, die wir boosten möchten, ausgenommen Leder, Pelzmäntel, Papier und Zucker. Voraussichtlich wird d = 18 sein. Dann scheint es sinnvoll, diese Waren auf den ersten d Inseln zu produzieren und Flussbetriebe auf den verbleibenden n - d Inseln zu boosten. Die Flussbauplätze auf den nicht geboosteten Inseln werte ich daher einfach, die anderen als 1,75. Die effektive Anzahl der Flussbauplätze beträgt also \sum_{i=1}^d a_i + 7/4 \sum_{i=d+1}^n a_i.
    Im Anhang ist ein Diagramm, das die effektiven Flussbauplätze darstellt.

    Die partielle Inselweltenordnung

    Am Anfang des Kapitels habe ich geschrieben, dass die Fähigkeit, zwei Karten zu vergleichen und die bessere auszuwählen, schon ausreichen würde, um die beste Karte auszuwählen. Das ist in seiner Allgemeinheit aber ein schweres Problem. Für eine Teilmenge ist das aber sehr einfach, denn offenbar ist eine Karte für den Rekordbau nicht von Belang, wenn jede wichtige Größe kleiner oder gleich der jeweiligen Größe einer anderen Karte ist. Das ist natürlich nicht allzu oft der Fall, allerdings kommt man damit schon weiter als gedacht. Für die ersten 10 Seeds sind die Anzahlen der Seeds, die eindeutig besser sind, wie folgt:

    Seed12345678910
    Anzahl201022808163715143627266183512061

    Scheint so, als gäbe es für viele Karten mindestens eine, die besser ist. In der Tat sind sage und schreibe 98411 Karten eindeutig schlechter als andere, wenn man Stein außer Acht lässt und die effektiven Flussbauplätze zu Rate zieht. Hier sind ein paar Tabellen, die die Anzahl der Karten für die Ressourcen angibt, die nur wenige mögliche Werte haben. Die anderen sind wieder in der PDF. Die Liste mit den 1588 verbleibenden Karten gibt es ebenfalls zum Download.

    222324252627
    Quarz 9372517466224
    Kohle42467104237
    Kupfer 39720596233
    9101112
    Gold 715738
    Perlen901175323
    678
    Variabel698361529

    Seedauswahl

    Hier gebe ich ein paar Denkanstöße, um gute Seeds zu finden. Offenbar gibt es da mehrere Herangehensweisen und ich denke, keine davon ist unbedingt die zielführendste.

    • Durch eine Abschwächung der partiellen Ordnung lassen sich noch mehr Seeds streichen. Man kann z. B. eine Ressource, die man als unwichtig erachtet, aus dem Vergleich herauslassen oder geringe Unterschiede in einer Größe übergehen.
    • Statt Karten anhand eines Vergleiches auszusortieren, kann man natürlich auch direkt die Werte einer Karte anschauen und anhand dessen entscheiden, ob sie es wert ist. Auch in den 1588 verbleibenden Karten sind welche mit deutlich zu wenig Bauplatz enthalten.
    • Indem man berechnet, wie viele Prozente an Zufriedenheit ein Ressourcenvorkommen oder ein Flussbauplatz pro Kopf liefert, kann man Karten eine Art Punktzahl zuweisen.

    Schlussendlich wird man allerdings auch hier tiefgreifende Kenntnisse in Wirtschaft vorweisen müssen, um eine fundierte Entscheidung treffen zu können. Das ist ein schweres Stück, aber wie eingangs erwähnt ist mein Ziel hier nicht, die beste Karte zu finden. Ich denke, das würde auch nicht allzu viel bringen, denn auch die könnte eine sehr spezielle Spielweise erfordern, um maximal viele Einwohner zu beherbergen. Ich rate daher dazu, bei der Seedsuche nicht krampfhaft nach dem Optimum zu suchen. Damit sollte nun alles Wichtige geklärt sein, um einen geeigneten Seed auszuwählen. Spitzfindige Leser haben vielleicht gemerkt, dass ich hier keine Frage gestellt hab. Das liegt daran, dass ich meinen Findungsprozess eines guten Seeds samt Ergebnis nicht darlegen werde, da ich möchte, dass der Leser zu seinem eigenen Entschluss kommt.

    Quote

    Ich kann euch die Tür zur Weisheit öffnen. Hindurchgehen müsst ihr selbst.

    Damit ist dieses Kapitel nun erst einmal abgeschlossen. Der Statistik-Wahnsinn II wird nun in eine Pause gehen, da ich erstmal anfange zu spielen und die weiteren Kapitel meiner Ansicht nach erst sinnvoll schreiben kann, wenn ich deren Inhalt in der Praxis erprobt habe. Am Ende jedes Kapitels gibt es noch Trivia, meinen Fortschritt und meine Motivation.

    Trivia: Einige Items referenzieren 1701. Die Zöllner sind Gustav Eichendorff und Tapferer Landsknecht stellt Igor Yegorov dar. Es gibt noch mehr Referenzen. Ich finde, das ist eine der Sachen, die man unterbewusst bemerkt, über die man aber nur selten aktiv nachdenkt, weswegen es dann doch eine Überraschung ist, wenn man drauf kommt.
    Bevölkerung: 0.
    Motivation: Bis zum Anschlag.

  • Moin Artey,

    eine Rückmeldung, nicht dass du meinst niemand liest deine Infos. Deine Liste wurde bereits von mindestens zwei Leuten heruntergeladen und analysiert. Du hast eine tolle Arbeit geleistet!

    Aus meiner Erfahrung aus 1404 hätte ich auch die Flussbauplätze und die Sole als wichtige Faktoren für eine gute Karte angesehen.

    Wer noch probieren möchte: Wir haben beide die TXT-Liste in eine Tabellenkalkulation exportiert. Dabei ist zu beachten, dass ein paar Inselnummer (4-5) die Zahlen von Quarz, Sole usw. um eine Spalte verschoben hat. Dort fehlte immer eine Insel. Karte 00110 ist die erste Insel, wo der Fehler bei mir war. Dann ist es einfach über einen Filter die anderen Karten zu finden.

    Gruß Wolfgang

  • Danke sehr. Ich denk mir schon, dass es ein paar stille Mitleser gibt.

    Die Flussbauplätze halte ich auch für wichtig, da sie gleich vier Waren produzieren können. Bei Sole ist das nicht so eindeutig, finde ich, da Sole sehr billig im Einkauf ist. Beide sind aber normalverteilt und schwanken stark, also sollte man sich da nicht abspeisen lassen, finde ich.

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!