Statistics per Wikibook

      

SI - Sinhala

Wikibooks rankings and chapter lists

The algorithm used for deriving book and section titles from chapter (article) titles is described below.

35 books ordered by size in bytes
3.2 kනවලොවට
2.4 kත්‍රිපිටක පොත් වහන්සේ
1.6 kMain
819සිංහල
21සන්දේශ
 කොමියුනිස්ට්
 Main Page
 වගකීමෙන්
 ඊසොප්ගේ
 මුද්‍රණ
 Hodiya
 ප්‍රභාකරන්
 දන්කොගෙ
 සමාජ
 මා
 නූතන
 ජීවනයට
 අන්දරේ
 සැළලිහිණි
 රවින්ද්‍රනාත්
 සමාධි
 මානව
 පරිගනකයේ
 මාධ්‍යයේ
 බලකොටුවක්
 බලකෙටුවක්
 බව
 ලංකා
 දන්කෝගේ
 රාහුල
 විවිධ
 රැවුල
 සදකඩපහනක
 හෙන්රි

35 books ordered by number of edits
53Main
13ත්‍රිපිටක පොත් වහන්සේ
7Hodiya
7මා
7දන්කෝගේ
7රැවුල
6ඊසොප්ගේ
5නවලොවට
5මාධ්‍යයේ
4සිංහල
4කොමියුනිස්ට්
4මානව
4බලකෙටුවක්
3දන්කොගෙ
3අන්දරේ
3සමාධි
3සදකඩපහනක
2සන්දේශ
2Main Page
2වගකීමෙන්
2මුද්‍රණ
2සමාජ
2නූතන
2සැළලිහිණි
2බලකොටුවක්
1ප්‍රභාකරන්
1ජීවනයට
1රවින්ද්‍රනාත්
1පරිගනකයේ
1බව
1ලංකා
1රාහුල
1විවිධ
1හෙන්රි

35 books ordered by number of registered authors
11Main
3ත්‍රිපිටක පොත් වහන්සේ
2Hodiya
2දන්කෝගේ
2ඊසොප්ගේ
2සිංහල
1රැවුල
1බලකෙටුවක්
1දන්කොගෙ
1අන්දරේ
1සමාධි
1සන්දේශ
1Main Page
1සැළලිහිණි
1බලකොටුවක්
1රවින්ද්‍රනාත්
1බව
1විවිධ
 මා
 නවලොවට
 මාධ්‍යයේ
 කොමියුනිස්ට්
 මානව
 සදකඩපහනක
 වගකීමෙන්
 මුද්‍රණ
 සමාජ
 නූතන
 ප්‍රභාකරන්
 ජීවනයට
 පරිගනකයේ
 ලංකා
 රාහුල
 හෙන්රි

35 books ordered by number of chapters
7ත්‍රිපිටක පොත් වහන්සේ
2Main Page
2කොමියුනිස්ට්
2වගකීමෙන්
1Main
1Hodiya
1දන්කෝගේ
1ඊසොප්ගේ
1සිංහල
1රැවුල
1බලකෙටුවක්
1දන්කොගෙ
1අන්දරේ
1සමාධි
1සන්දේශ
1සැළලිහිණි
1බලකොටුවක්
1රවින්ද්‍රනාත්
1බව
1විවිධ
1මා
1නවලොවට
1මාධ්‍යයේ
1මානව
1සදකඩපහනක
1මුද්‍රණ
1සමාජ
1නූතන
1ප්‍රභාකරන්
1ජීවනයට
1පරිගනකයේ
1ලංකා
1රාහුල
1හෙන්රි





Legend

Section title
[Aaaa] = book section when article with same title does exist
[Aaaa] = book section when article with same title does not exist

Chapter size
Chapter size in bytes: Xaaa > 2000 ≥ Yaaa ≥ 500 > Zaaa will be shown as: Xaaa / Yaaa / Zaaa / Xaaa / Yaaa / Zaaa

Choose from three display modes (click below at 'Select' to change display mode, changing may take a few seconds on large files)

Select mode "Xaaa / Yaaa / Zaaa"    => font color varies, large chapters are shown in bold type
Select mode   "Xaaa / Yaaa / Zaaa"     => font color and size vary
Select mode   "Xaaa / Yaaa / Zaaa"  => font color, size and weight vary


ත්‍රිපිටක පොත් වහන්සේ

7 chapters, 13 edits, size 2.9 kB, 334 words, 3 registered authors

[box]   -footer / -header
[සූත්‍ර පිටකය]   -දීඝ නිකාය

අභිධර්ම පිටකය / විනය පිටකය


කොමියුනිස්ට්

2 chapters, 4 edits, size 249 , 0 words

පක්ෂයේ ප්‍රකාශනය / ප්‍රකාශනය


Main Page

2 chapters, 2 edits, size 25 , 0 words

[box]   -footer / -header


වගකීමෙන්

2 chapters, 2 edits, size 5.7 kB, 0 words

බැහැරට ගිය නූතන මාධ්‍ය පන්හිද / බැහැරට ගිය නූතන මාධ්‍ය පන්හිඳ



Remainder

Books that seemingly are not divided into chapters
 
H  Hodiya  
M  Main  
  අන්දරේ  
  ඊසොප්ගේ  
  ජීවනයට  
  දන්කොගෙ / දන්කෝගේ  
  නවලොවට / නූතන  
  පරිගනකයේ / ප්‍රභාකරන්  
  බලකෙටුවක් / බලකොටුවක් / බව  
  මා / මාධ්‍යයේ / මානව / මුද්‍රණ  
  රවින්ද්‍රනාත් / රාහුල / රැවුල  
  ලංකා  
  විවිධ  
  සදකඩපහනක / සන්දේශ / සමාජ / සමාධි / සැළලිහිණි / සිංහල  
  හෙන්රි



Legend

Section title
[Aaaa] = book section when article with same title does exist
[Aaaa] = book section when article with same title does not exist

Chapter size
Chapter size in bytes: Xaaa > 2000 ≥ Yaaa ≥ 500 > Zaaa will be shown as: Xaaa / Yaaa / Zaaa / Xaaa / Yaaa / Zaaa

Choose from three display modes (click below at 'Select' to change display mode, changing may take a few seconds on large files)

Select mode "Xaaa / Yaaa / Zaaa"    => font color varies, large chapters are shown in bold type
Select mode   "Xaaa / Yaaa / Zaaa"     => font color and size vary
Select mode   "Xaaa / Yaaa / Zaaa"  => font color, size and weight vary



Algorithm

The algorithm used to detect book titles is roughly this:

On a first pass through the input, article titles are scanned for candidate book and chapter names as follows:
Find the first colon, forward slash and hyphen. Whichever of these comes first determines division between book and chapter title.
If none of these are found treat text between brackets as chapter title, rest as book title.
If no brackets are found and the article title ends with one or more digits, assume this is a numbered chapter.
On a second pass book titles that occurred less than three times are marked as possible false positives
Article titles which match exactly a candidate book name that occurs more than twice, are added to the selection
(these are introductory pages, first chapters, or how you want to call them)
Counts are now collected.

Before writing the report, books are further divided into 'subbooks' and single chapters, using almost the same algorithm as above,
except that now subbook titles without colon, slash, hyphen, bracket or trailing digit are matched for the longest text
that occurs several times within one book.

Generated on Wednesday November 25, 2009 from recent database dump files.
Data processed up to Saturday October 31, 2009
Please note that the lengthy dump process (many weeks) means a delay in publishing these statistics is always to be expected.

Script version:2.5
Author:Erik Zachte (Web site)
Mail:ezachte@### (no spam: ### = wikimedia.org)
For documentation see meta
Scripts: scripts.zip

All data and images on this page are in the public domain.